Chapitre1 2019 PDF

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 182

UNIVERSITÉ HASSAN II DE CASABLANCA

FACULTÉ DES SCIENCES ET TECHNIQUES

PROBABILITES ET STATISTIQUE

Pr. Abdelhak FAHSI


Département de Mathematiques

Module M147, Parcours MIP (S4)


UNIVERSITÉ HASSAN II DE CASABLANCA
FACULTÉ DES SCIENCES ET TECHNIQUES

1ère Partie
STATISTIQUE DESCRIPTIVE

Pr. Abdelhak FAHSI


Département de Mathematiques

Module M147, Parcours MIP (S4)


Introduction générale

1ère partie : STATISTIQUE DESCRIPTIVE - Introduction Module M147 - MIP Pr. A. FAHSI
Le traitement et l’analyse de l’information statistique sont
au coeur de tous les processus de gestion, de prévision et
de décision.

La statistique trouve ses applications dans plusieurs


domaines scientifiques de différentes natures : économie,
biologie, chimie, physique, sociologie, médecine, sciences
de l’ingénieur, ...

1ère partie : STATISTIQUE DESCRIPTIVE - Introduction Module M147 - MIP Pr. A. FAHSI
La statistique comporte deux granes branches :

La Statistique Descriptive : C’est un ensemble de


techniques scientifiques permettant de présenter, résumer,
analyser et interpréter des données statistiques. Ces
techniques peuvent être numériques (élaboration de
tableaux, calcul de paramètres) ou graphiques
(visualisation par des représentations graphiques).

1ère partie : STATISTIQUE DESCRIPTIVE - Introduction Module M147 - MIP Pr. A. FAHSI
La Statistique Mathématique : C’est un ensemble de
méthodes mathématiques, basées sur la modélisation et le
calcul des probabilités, qui permettent à partir de l’étude
d’un échantillon de déduire des informations, faire des
prévisions et prendre des décisions concernant une
population plus grande.

Dans cette 1ère partie du cours, on se limite à l’étude de la


statistique descriptive à une et à deux dimensions.

1ère partie : STATISTIQUE DESCRIPTIVE - Introduction Module M147 - MIP Pr. A. FAHSI
Objectifs de ce cours :
Apprendre et comprendre les principales techniques
de la statistique descriptive à une dimension et à
deux dimensions.
Être capable de mettre en oeuvre ces techniques de
manière appropriée pour décrire, organiser, analyser et
interpréter des données statistiques.
En résumé, Au bout de ce cours, l’étudiant doit être
capable de répondre à des questions de ce genre :

1ère partie : STATISTIQUE DESCRIPTIVE - Introduction Module M147 - MIP Pr. A. FAHSI
Exercice 1
L’observation de la consommation énergétique quotidienne
(en kwh) dans un local commercial durant une année a
donné les résultats suivants :

Consommation [8, 10[ [10, 14[ [14, 16[ [16, 20[ [20, 24[
Effectif 55 60 80 120 50
1 Préciser la population étudiée, le caractère étudié et sa
nature.
2 Tracer les diagrammes qui permettent de représenter
cette distribution statistique.
3 Calculer le mode, la médiane, la moyenne et
l’écart-type.
4 Calculer la proportion des jours dont la consommation
est comprise entre 11 et 22 kwh.
1ère partie : STATISTIQUE DESCRIPTIVE - Introduction Module M147 - MIP Pr. A. FAHSI
Exercice 2
La distribution conjointe d’un groupe d’étudiants selon la
note obtenue en module de statistique (caractère X ) et le
nombre d’absence aux cours et travaux dirigés (caractère
Y ) est représentée dans le tableau suivant :

Y 0 1 2 3 4
X
[0, 6[ 0 4 3 8 12
[6, 10[ 3 7 10 12 18
[10, 12[ 6 8 9 8 7
[12, 14[ 7 6 5 3 2
[14, 16[ 8 3 2 0 0
[16, 20[ 9 4 1 0 0

1ère partie : STATISTIQUE DESCRIPTIVE - Introduction Module M147 - MIP Pr. A. FAHSI
1 Déterminer les distributions marginales.
2 Tracer l’histogramme et la courbe cumulative de la
distribution marginale de X .
3 Calculer le mode et la médiane de X et de Y .
4 Calculer la covariance des deux variables X et Y .
5 Calculer le coefficient de corrélation linéaire.
Commenter.

1ère partie : STATISTIQUE DESCRIPTIVE - Introduction Module M147 - MIP Pr. A. FAHSI
Plan du cours

1 Chapitre 1 : Statistique descriptive 1D (séries simples)


I- Définitions
II- Organisation des données
II.1- Tableaux statistiques
II.2- Représentations graphiques
III- Réduction des données
III.1- Paramètres de tendance centrale
III.1- Paramètres de position
III.2- Paramètres de dispersion

2 Chapitre 2 : Statistique descriptive 2D (séries doubles)


I- Tableau de contingence
II- Paramètres d’une série double
III- Ajustement linéaire

1ère partie : STATISTIQUE DESCRIPTIVE - Introduction Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

Chapitre 1

Statistique descriptive à une


dimension

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

I- Définitions

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

1. Population (notée P) : On appelle population, l’ensemble de


tous les éléments sur lesquels on veut effectuer l’étude
statistique.

Exemple
- Les étudiants inscrits à la FSTM,
- Les voitures vendues au Maroc entre 2010 et 2016,
- Les jours de l’année 2018.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

2. Individu : Chaque élément de la population est appelé


individu (ou unité statistique).

Les individus de la population peuvent être des êtres vivants


(humains, animaux, . . . ) ou des objets (voitures, livres, . . . ) ou
des éléments abstraits (accidents, jours, . . . ).

Le nombre des individus d’une population, noté N, est appelé


taille ou effectif total de la population.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

3. Echantillon : Un groupe restreint d’individus prélevés dans


la population P (sous-ensemble de P) est appelé un
échantillon de P.

Remarque : On se limite à l’étude d’un échantillon lorsque’il


est impossible ou très difficile d’étudier la population dans sa
totalité.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

4. Caractère (variable) statistique (noté X , Y , . . .) : On appelle


caractère (ou variable) statistique toute caractéristique qui
peut être observée ou mésurée pour chaque individu de la
population.

Exemple
- La couleur des voitures fabriquées par une usine,
- Les notes d’un groupe d’étudiants,
- Le salaire des employés d’une entreprise,
- La consommation quotidienne d’électricité durant une année,

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

On distingue deux types de caractères :


Caractère qualitatif : C’est un caractère non mesurable.
Les valeurs du caractère ne sont pas numériques.

Exemple
La couleur, la nationalité, la situation familiale, . . .

Caractère quantitatif : C’est un caractère mesurable. Les


valeurs du caractère sont numériques.

Exemple
L’âge, le poids, la taille, le salaire, . . .

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

5. Série brute :
Considérons un caractère X sur une population P de taille N.

A chaque individu de la population est associée une valeur du


caractère, notée x(i) .

La suite des valeurs x(1) , x(2) , . . . , x(N) (non nécessairement


distintes) est appelée série brute du caractère X .

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

Exemple
On considère le caractère X =”état civil” des employés d’une
entreprise.
On considère la codification : C=célibataire, D=divorcé(e),
M=marié(e), V=veuf(ve).

On suppose le résultat suivant (série brute) :


M M D C C M C C C M
C M V M V D C C D M

On a : x(1) = M, x(2) = M, x(3) = D, . . . , x(20) = M.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

6. Modalités d’un caractère X : Les différentes valeurs


distinctes prises par le caractère X , notées x1 , x2 , . . . , xk , sont
appelées modalités de X .

L’ensemble des modalités d’un caractère X est noté :

X (P) = {x1 , x2 , . . . , xk }

k désigne le nombre de modalités de X .

Exemple
- Les modalités du caractère X = ”état civil” sont :
{C, D, M, V }
- Le caractère X = ”nombre d’enfants par famille” peut avoir
comme modalités : {0, 1, 2, 3, 4, 5, 6 et plus}.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

7. Effectif (noté ni ) : L’effectif d’une modalité xi est le nombre


d’individus présentant cette modalité.

L’effectif total de la population est égal à la somme des


effectifs de toutes les modalités du caractère étudié. On a :
k
X
ni = N
i=1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

8. Effectif cumulé (noté Ni ) : On suppose les modalités


ordonnées :
x1 < x2 < . . . < xk
L’effectif cumulé d’une modalité xi est le nombre d’individus de
la population pour lesquels la valeur du caractère est
inférieure ou égale à xi . On a :

N1 = n1
i
X
Ni = nj = Ni−1 + ni , pour i ≥ 2
j=1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

9. Fréquence ou proportion (notée fi ) : La fréquence d’une


n
modalité xi , est le rapport fi = i .
N

C’est la proportion des individus de la population présentant


cette modalité. On a :
Xk
fi = 1
i=1

Remarque
La fréquence fi appartient à l’intervalle [0, 1].

Souvent, on note les fréquences en pourcentage (avec le


symbole %) en les multipliant par 100.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

10. Fréquence cumulée (notée Fi ) : La fréquence cumulée


d’une modalité xi est la proportion d’individus pour lesquels la
valeur du caractère est inférieure ou égale à xi . On a :

F 1 = f1
i
Ni X
Fi = = fj = Fi−1 + fi , pour i ≥ 2
N
j=1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

11. Groupement en classes


Lorsque le nombre des modalités d’un caractère
quantitatif est élevé (supérieur à 15), on est généralement
conduit à regrouper les modalités en classes de la forme :

[xi ; xi+1 [ (ou ]xi ; xi+1 ]), i = 1, 2, . . . , k

Exemple
Le caractère X = ”Consommation quotidienne d’électricité (en
kwh) dans un local commercial durant une année” peut avoir
comme modalités groupées en classes :

[8; 10[, [10; 14[, [14; 16[, [16; 20[, [20; 24[

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

On appelle effectif d’une classe [xi ; xi+1 [ (noté ni ) le nombre


d’individus ayant une valeur du caractère appartenant à cette
classe.

On appelle effectif cumulé de la classe [xi ; xi+1 [ (noté Ni ) le


nombre d’individus pour lesquels la valeur du caractè est
inférieure ou égale à xi+1 ,

On appelle effectif cumulé d’une valeur x du caractère X (noté


N(x)) le nombre d’individus pour lesquels la valeur du
caractère est inférieure ou égale à x.

On a des définitions analogues pour les fréquences et les


fréquences cumulées.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

Règles de construction des classes


Fixer un nombre de classes ni trop petit ni trop grand
(généralement de 5 à 15).
Choisir des bornes qui, autant que possible, permettront
des calculs simples.
Considérer des classes adjacentes fermées d’un côté et
ouvertes de l’autre.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

Remarque
Le groupement en classes d’une série statistique correspond à
une perte d’informations par rapport aux données initiales. Le
travail avec un tel groupement impose alors l’hypothèse de la
répartition uniforme des données à l’intérieur de chaque
classe.

Ainsi, à toute partie A = [a; b] inclue dans une classe [xi ; xi+1 [
d’effectif ni correspond un effectif n(A) défini par :

(b − a)
n(A) = ni ×
(xi+1 − xi )

Dans ce cas, l’effectif de toute valeur isolée sera égal à zéro.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

12. Types d’un caractère quantitatif:


On distingue deux types de caractère quantitatif :

Caractère discret :
Si les modalités d’un caractère quantitatif X sont considérées
sous forme de valeurs isolées, discrètes x1 , x2 , . . . , xk , on dit
que X est un caractère de type discret.

La famille {(xi , ni )1≤i≤k } ou {(xi , fi )1≤i≤k } est appelée série ou


distribution statistique discrète associée au caractère X .

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

Caractère continu :

Si les modalités d’un caractère X sont groupées sous forme


de classes [x1 ; x2 [, . . . , [xk ; xk+1 [, on dit que X est un caractère
de type continu.

La famille {([xi ; xi+1 [, ni )1≤i≤k } ou {([xi ; xi+1 [, fi )1≤i≤k } est


appelée série ou distribution statistique continue associée au
caractère X .

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

II- Organisation des données

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

La première étape dans une étude statistique consiste à


organiser les données statistiques observées pour pouvoir en
déduire un certain nombre de renseignements qualitatifs et
quantitatifs.

Cet objectif peut être atteint en présentant les données


observées sous forme de :
1 Tableaux statistiques,
2 Représentations graphiques,

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

II.1- Tableaux statistiques

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Un tableau statistique consiste à résumer et présenter les


données d’une série statistique associée à un caractère X
sous forme de distributions d’effectifs ou de fréquences en
fonction des modalités :

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Modalités Effectifs ...


xi ni
x1 n1
x2 n2
.. ..
. .
xk nk
Total N

Tableau statistique simple

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Modalités Fréquences ...


xi fi
x1 f1
x2 f2
.. ..
. .
xk fk
Total 1

Tableau statistique simple

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Modalités Effectifs Fréquences Eff. Cum. Fréq. Cum. ...


xi ni fi Ni Fi
x1 n1 f1 N1 = n1 F1 = f1
x2 n2 f2 N2 F2
.. .. .. .. ..
. . . . .
xk nk fk Nk = N Fk = 1
Total N 1

Tableau statistique détaillé

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Exemple1 : Dans un atelier de contrôle technique, on a


enquêté sur l’état mécanique d’un échantillon de 70 voitures,
après 5 ans de leur mise en circulation.
On a obtenu la série statistique brute suivante :

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Bon Bon Moyen Bon Bon Mauvais


Excellent Moyen Bon Bon Excellent Moyen
Moyen Bon Excellent Mauvais Bon Bon
Bon Mauvais Excellent Bon Bon Excellent
Bon Moyen Mauvais Moyen Excellent Bon
Bon Moyen Excellent Bon Bon Excellent
Mauvais Moyen Excellent Bon Bon Moyen
Bon Excellent Bon Moyen Excellent Bon
Moyen Bon Excellent Bon Mauvais Moyen
Bon Bon Moyen Bon Bon Moyen
Mauvais Excellent Bon Moyen Bon Bon
Moyen Moyen Bon Excellent

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Tableau statistique : Les résultats statistiques de cette enquête


sont résumés et présentés dans le tableau statistique suivant :

Etat Mécanique Effectif Fréquence ...


ni fi
Mauvais 7 0.1
Moyen 17 0.24
Bon 32 0.46
Excellent 14 0.2
Total 70 1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Exemple2 : Dans un échantillon composé de 50 familles, on


enquête sur le nombre d’enfants par famille.
Les résultats de l’enquête statistique sont :

1 0 5 2 2 1 2 1 2 4
4 7 1 3 2 5 4 6 3 1
1 6 1 3 8 1 3 5 2 3
3 0 3 4 6 4 1 7 2 0
2 0 1 2 2 3 2 5 6 2

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Tableau statistique :

Nombre Effectif ...


d’enfants ni
0 4
1 10
2 12
3 8
4 5
5 4
6 4
7 2
8 1
Total 50

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Tableau statistique détaillé :

Nombre Effectif Eff. cum. Fréquence Fréq. cum. ...


d’enfants ni Ni fi Fi
0 4 4 0.08 0.08
1 10 14 0.2 0.28
2 12 26 0.24 0.52
3 8 34 0.16 0.68
4 5 39 0.1 0.78
5 4 43 0.08 0.86
6 4 47 0.08 0.94
7 2 49 0.04 0.98
8 1 50 0.02 1
Total 50 1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Exemple3 : En mesurant la taille de 50 femmes enceintes, on


a obtenu les résultats suivants (en cm) :

152 151.5 160 165 170


159 168 161 164 156
158.5 167 157 170.5 161.5
169 156 158.5 160.5 152
156.5 166 152.5 170 165
154 170 165 155.5 166.5
162.5 152.5 168 169 158
157 161 154.5 162 158
153.5 157.5 163 155 153
160 169.5 154 161 162

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Le nombre des modalités observées étant élevé, il est donc


nécessaire de les grouper en classes.
Le caractère étudié sera alors traité comme un caractère
continu.

On peut considérer le choix des classes suivantes :

[151; 155[
[155; 159[
[159; 163[
[163; 167[
[167; 171[

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Tableau statistique :

Taille Effectif ...


(en cm) ni
[151; 155[ 10
[155; 159[ 12
[159; 163[ 11
[163; 167[ 7
[167; 171[ 10
Total 50

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

II.2- Representations
graphiques

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Bien que un tableau statistique résume toute l’information


d’une distribution statistique, la représentation graphique
permet de visualiser et de déceler les principales
caractéristiques de la distribution statistique (tendance,
symétrie, dispersion, concentration, . . . ).

La représentation graphique des données relatives à un


caractère repose (selon le type du caractère) sur la
proportionnalité des longueurs ou des surfaces aux
effectifs des différentes modalités du caractère.

Ainsi, suivant le type du caractère étudié, on utilise


différents modes de représentations graphiques.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

A. Caractère qualitatif :
Pour représenter une distribution statistique d’un
caractère qualitatif, on peut utiliser un diagramme en
rectangles ou un diagramme circulaire.

Considérons l’exemple1 : Etat mécanique des voitures :


Etat Mécanique Effectif Fréquence
ni fi
Mauvais 7 0.1
Moyen 17 0.24
Bon 32 0.46
Excellent 14 0.2
Total 70 1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

A.1) Diagramme en rectangles (ou en tuyaux d’orgue) :

On représente chaque modalité par un rectangle dont la


hauteur est égale à l’effectif (ou à la fréquence) de la modalité
et dont la base est constante.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Effectif
35

30

25

20

32
15

10
17
14
5
7

0
Mauvais Moyen Bon Excellent

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

A.2) Diagramme circulaire ( ou sectoriel) :

Chaque modalité est représentée par un secteur dont l’angle


est proportionnel à l’effectif (ou à la fréquence) correspondant.
La totalité de la circonférence (360◦ ) correspond à l’effectif
total N.

Le tableau suivant donne l’angle αi correspondant à chaque


modalité (αi = 360 × ni /N = 360 × fi ) :

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Etat Effectif Angle


Mécanique ni αi
Mauvais 7 36◦
Moyen 17 87.4◦
Bon 32 164.6◦
Excellent 14 72◦
Total 70 360◦

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Diagramme circulaire Mauvais


10%

Excellent
20%

Moyen
24%

Bon
46%

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

B. Caractère quantitatif discret :


Pour représenter une distribution statistique d’un
caractère quantitatif discret, on peut utiliser le diagramme
en batôns, le polygone des fréquences ou le diagramme
en escalier (courbe cumulative).

Considérons l’exemple2 (Nombre d’enfants par famille) :

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Nombre Effectif Fréquence Eff. cum. Fréq. cum.


d’enfants ni fi Ni Fi
0 4 0.08 4 0.08
1 10 0.2 14 0.28
2 12 0.24 26 0.52
3 8 0.16 34 0.68
4 5 0.1 39 0.78
5 4 0.08 43 0.86
6 4 0.08 47 0.94
7 2 0.04 49 0.98
8 1 0.02 50 1
Total 50 1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

B.1) Diagramme en bâtons :

Le diagramme en bâtons consiste à représenter, dans un


repère cartésien, chaque modalité du caractère par un
segment de droite vertical dont la hauteur est égale à l’effectif
(ou à la fréquence) de la modalité.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

15 0.3
Effectif ni Fréquence fi

10 0.2

5 0.1

0 xi 0 xi
0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8

Figure: Diagramme en bâtons.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

B.2) Polygone des frèquences :

Le polygone des frèquences est construit en joignant par des


segments de droites les sommets des bâtons du diagramme
en bâtons.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

15

10

ni

0
0 1 2 3 4 5 6 7 8 x
i

Figure: Polygone des fréquences.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

B.3) Diagramme en escaliers - Courbe cumulative :

On suppose x1 < x2 < . . . < xk


À partir des effectifs cumulés Ni , on peut définir la fonction
de répartition des effectifs, notée G(x), définie de IR vers
[0, N] :
G(x) représente le nombre des individus de la population
pour lesquels la valeur du caractère est inférieure ou
égale à x.
À partir des fréquences cumulées Fi , on peut définir la
fonction de répartition des fréquences, notée F (x), définie
de IR vers [0, 1] :
F (x) représente la proportion des individus de la
population pour lesquels la valeur du caractère est
inférieure ou égale à x.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Donc, par définition :


La fonction de répartition des effectifs G(x) est définie par :

 0 si x < x1
G(x) = N si xi ≤ x < xi+1 , 1 ≤ i ≤ k − 1
 i
N si x ≥ xk

La fonction de répartition des fréquences F (x) est définie par :



 0 si x < x1
F (x) = F si xi ≤ x < xi+1 , 1 ≤ i ≤ k − 1
 i
1 si x ≥ xk

On a :
G(x)
F (x) =
N

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Le diagramme en escalier ou la courbe cumulative (appelée


aussi courbe des effectifs cumulées ou courbe des fréquences
cumulés), est la représentation graphique de la fonction de
répartition G(x) ou F (x).

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

G(x) F(x)
50 1

40 0.8

30 0.6

20 0.4

10 0.2

0 x 0 x
0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8

Figure: Courbe cumulative.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Remarque
F (x) (resp. G(x)) est nulle pour les valeurs de x
inférieures à la plus petite modalité x1 et elle est égale à 1
(resp. N) pour les valeurs de x supérieures ou égale à la
plus grande modalité xk .
F (x) (resp. G(x)) est constante, égale à F (xi ) (resp.
G(xi )), dans chaque intervalle xi ≤ x < xi+1 .
Ainsi, la courbe cumulative d’un caractère discret
présente l’aspect d’un escalier (fonction croissante et
constante par morceaux).

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

C. Caractère quantitatif continu :


Pour représenter une distribution statistique d’un
caractère quantitatif continu, on peut utiliser
l’histogramme, le polygone des fréquences ou la courbe
cumulative.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

C.1) Histogramme et Polygone des fréquences :

Les modalités sont présentées sous forme de classes


[xi ; xi+1 [, 1 ≤ i ≤ k.

L’histogramme d’un caractère continu consiste à représenter


chaque classe [xi ; xi+1 [ du caractère par un rectangle vertical
dont la base est égale à l’amplitude de la classe, notée
ai = xi+1 − xi , et dont la hauteur hi est telle que la surface
Si = ai × hi du rectangle soit proportionnelle à l’effectif ni (ou à
la fréquence fi ) de la classe :

Si = C × ni ou bien Si = C × fi

avec C une constante arbitraire à choisir.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

On distingue deux cas :

1er cas : Toutes les classes ont une même amplitude a.


Dans ce cas, pour tracer l’histogramme, on représente chaque
classe par un rectangle dont la hauteur est égale à l’effectif (ou
à la fréquence) de la classe. La base de tous les rectangles
étant la même (égale à l’amplitude a).

Cela revient à choisir la constante C égale à l’amplitude a.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Exemple3 : Taille des femmes enceintes (Classes de même


amplitude)

Taille Effectif
(en cm) ni
[151; 155[ 10
[155; 159[ 12
[159; 163[ 11
[163; 167[ 7
[167; 171[ 10
Total 50

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Histogramme : Toutes les classes ont la même amplitude.

15
Effectif ni

10

0
151 155 159 163 167 171 Taille

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Polygone des fréquences :

Lorsque toutes les classes ont une même amplitude, le


polygone des fréquences est construit, à partir de
l’histogramme, en joignant par des segments de droites les
milieux des côtés supérieurs des rectangles.

Les extrémités rejoignent l’axe des abscisses.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Polygone des fréquences : Classes de même amplitude.

15
Effectif ni

10

0
151 155 159 163 167 171 Taille

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

2ème cas : Les classes n’ont pas la même amplitude.


Dans ce cas, pour construire l’histogramme, chaque classe
[xi ; xi+1 [ doit être représentée par un rectangle dont la base
est égale à l’amplitude ai de la classe et dont la hauteur hi est
définie par :

ni fi
hi = C × ou bien hi = C ×
ai ai

où C est une constante de proportionnalité à choisir.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

hi est appelée effectif corrigé (ou fréquence corrigée) de la


classe [xi ; xi+1 [.

Le choix de la constante C est arbitraire (on peut choisir par


exemple, C = 1).

Cependant, pour simplifier les calculs et/ou pour tracer le


polygone des fréquences, il faut choisir C égale au plus grand
diviseur commun des amplitudes ai .

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Exemple3 : Taille des femmes enceintes (Classes avec des


amplitudes différentes)

Taille amplitude Effectif Eff. corrigé


(en cm) ai ni hi
[151; 155[ 4 10 10
[155; 159[ 4 12 12
[159; 167[ 8 18 9
[167; 171[ 4 10 10
Total 50

ni
avec hi = C × ( on a choisi C = PGDC(ai ) = 4).
ai

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Histogramme : avec effectifs corrigés (amplitudes différentes).

15
Effectif corrigé hi
(C=4)

10

0 Taille
151 155 159 163 167 171

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Polygone des fréquences (amplitudes différentes) :

Puisqu’on a choisi C = PGCD(ai ), alors chaque amplitude ai


est un multiple de C. On a alors :

ai = ki × C, avec ki un entier

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Pour construire le polygone des fréquences, on considère


chaque rectangle de l’histogramme, de base ai = xi+1 − xi ,
comme une réunion de ki sous-rectangles de même base C.

Puis, on trace les milieux des côtés supérieurs des


sous-rectangles de base C et on joint ces milieux
successivement par des segments de droites.

Les extrémités du polygone rejoignent l’axe des abscisses.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Polygone des fréquences : amplitudes différentes.

15
Effectif corrigé hi
(C=4)

10

0 Taille
151 155 159 163 167 171

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Remarque

L’aire des rectangles de l’histogramme est égale à l’aire


délimité par le polygone des fréquences.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

15 15
Effectif ni Effectif corrigé hi
(C=4)

10 10

S1

5 5 S1+ S2
S2

0 0
151 155 159 163 167 171 Taille 151 155 159 163 167 171 Taille

Figure: La surface est conservée.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

15 15
Effectif ni Effectif corrigé hi
(C=4)

10 10

5 5

0 0
151 155 159 163 167 171 Taille 151 155 159 163 167 171 Taille

Figure: La surface est conservée.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

C.2) Courbe cumulative - Fonction de répartition :

Comme pour le cas discret, on définit pour un caractère


continu une fonction de répartition à partir des effectifs
cumulés ou à partir des fréquences cumulées :

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

La fonction de répartition des effectifs, notée G(x), définie


de IR vers [0, N] :
Elle représente le nombre des individus de la population
pour lesquels la valeur du caractère est inférieure ou
égale à x.
La fonction de répartition des fréquences, notée F (x),
définie de IR vers [0, 1] :
Elle représente la proportion des individus de la
population pour lesquels la valeur du caractère est
inférieure ou égale à x.
On a :
G(x)
F (x) =
N

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Remarques
Par définition, on a :

Ni = G(xi+1 ), pour 1 ≤ i ≤ k

Fi = F (xi+1 ), pour 1 ≤ i ≤ k
G(x1 ) = F (x1 ) = 0
avec Ni (resp. Fi ) est l’effectif cumulé (resp. la fréquence
cumulée) de la classe [xi , xi+1 [.

On connait donc les valeurs des fonctions de répartition


G(x) et F (x) aux points xi pour 1 ≤ i ≤ k + 1.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

L’hypothèse d’équirépartition des données à l’intérieur de


chaque classe implique que la fonction de répartition est
linéaire à l’intérieur de chaque classe.
La fonction de répartition d’un caractère continu est donc
croissante, continue et linéaire par morceaux.
Ainsi, la fonction de répartition des effectifs G(x) et la
fonction de répartition des fréquences F (x) sont définies
par :

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données


 0
 si x ≤ x1
G(xi+1 )−G(xi )
G(x) = G(xi ) + xi+1 −xi (x − xi ) si xi ≤ x ≤ xi+1 , 1 ≤ i ≤ k

 N si x ≥ xk+1


 0
 si x ≤ x1
F (xi+1 )−F (xi )
F (x) = F (xi ) + xi+1 −xi (x − xi ) si xi ≤ x ≤ xi+1 , 1 ≤ i ≤ k

 1 si x ≥ xk+1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

La courbe cumulative est la représentation graphique de la


fonction de répartition G(x) ou F (x).

Exemple3 : Taille des femmes enceintes

Taille Effectif Eff. cum. Fréq. cum.


ni Ni Fi
[151; 155[ 10 10 0.2
[155; 159[ 12 22 0.44
[159; 163[ 11 33 0.66
[163; 167[ 7 40 0.8
[167; 171[ 10 50 1
Total 50

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Effectif cumulé (G(x)) Fréquence cumulée (F(x))


N= 50 1

40 0.8

30 0.6

20 0.4

10 0.2

0 0
151 155 159 163 167 171 Taille 151 155 159 163 167 171 Taille

Figure: Courbe cumulative.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Remarque
La courbe cumulative est construite en joignant
successivement, par des segments de droites, les points
de coordonnées (xi , G(xi )) (ou (xi , F (xi ))), 1 ≤ i ≤ k + 1.
Aux points extremes x1 et xk+1 , la courbe est
horizontalement prolongée respectivement vers la gauche
et vers la droite.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II.1- Tableaux statistiques
II- Organisation des données
II.2- Representations graphiques
III- Réduction des données

Remarque :
F (x) (resp. G(x)) est une fonction continue, croissante et
linéaire par morceaux.
On a, par définition :
F (a) = Pr (X ≤ a) = Pr (X < a), (avec Pr =proportion)
On en déduit :
Pr (X > a) = Pr (X ≥ a) = 1 − F (a)
Pr (a ≤ X ≤ b) = Pr (a < X < b) = F (b) − F (a)
Pr (X = a) = 0
Ainsi, pour un caractère continu, les inégalités largee et
les inégalités strictes sont confondues et la proportion
d’une valeur isolée est égale à zéro.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

III- Réduction des données


statistiques

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
I- Définitions
II- Organisation des données
III- Réduction des données

Les tableaux statistiques et les représentations


graphiques présentent une information globale et détaillée
de la distribution d’un caractère.
Cependant, il est souvent très utile de chercher à réduire
l’information globale par des paramètres (ou indicateurs)
qui résument les caractéristiques essentielles de la
distribution et indiquent comment les valeurs de la série
se répartissent autour de ces paramètres.
Dans la suite, on va définir et interpréter les différents
types de paramètres les plus fréquemment utilisés en
statistique descriptive.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

III.1- Paramètres de tendance


centrale

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Les paramètres de tendance centrale permettent de savoir


autour de quelles valeurs, situées au centre, se répartissent
les données d’une série statistique.

Dans ce paragraphe, on va définir trois paramètres de


tendance centrale, fréquemment utilisés : la moyenne, le
mode et la médiane.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

1- La moyenne

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Selon l’usage courant, lorsqu’on parle de moyenne, on pense


à la moyenne arithmétique. Cependant, il existe d’autres types
de moyennes.

Chaque type de moyennes présente la propriété de conserver


une caractéristique de l’ensemble des observations quand on
remplace chaque élément par cette valeur moyenne.

La moyenne n’est définie que pour un caractère statistique


quantitatif.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Définition
Soient P une population de taille N, X un caractère quantitatif
et x(1) , x(2) , . . . , x(N) la série statistique brute associée à X
(ces valeurs ne sont pas nécessairement toutes distinctes).

La moyenne arithmétique du caractère X , notée X , qu’on


appelle tout simplement moyenne, est égale à la somme de
toutes les valeurs observées divisée par le nombre de ces
valeurs :
N
1X
X = x(i)
N
i=1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Remarque

La moyenne arithmétique conserve la somme totale des


valeurs observées :
- Si on remplace toutes les valeurs observées par leur
moyenne, la somme totale sera inchangée.
- Si on modifie les valeurs de deux observations tout en
conservant leur somme, la moyenne sera inchangée.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Détermination pratique :

a. Cas d’un caractère discret :

Soit {(xi , ni )1≤i≤k } une distribution statistique discrète. On a :

k k
1X X
X = ni xi = fi xi
N
i=1 i=1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Exemple
Considérons l’exemple 2 (Nombre d’enfants par famille) :

Les calculs peuvent être résumés dans le tableau suivant :

xi 0 1 2 3 4 5 6 7 8 Total
ni 4 10 12 8 5 4 4 2 1 50
ni × xi 0 10 24 24 20 20 24 14 8 144

Donc
144
X = = 2.88
50

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

b. Cas d’un caractère continu :

Soit {([xi , xi+1 [, ni )1≤i≤k } une distribution statistique continue.

En raison de l’hypothèse d’équi-répartition à l’intérieur des


classes, on suppose que la moyenne des observations à
l’intérieur d’une classe [xi , xi+1 [ est égale au centre de la
x + xi+1
classe ci = i . On a alors :
2

k k
1X X
X = ni ci = fi ci
N
i=1 i=1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Exemple
Considérons l’exemple 3 (Taille d’un groupe de femmes).

Les calculs peuvent être résumés dans le tableau suivant :


[xi ; xi+1 [ ni ci ni × ci
[151; 155[ 10 153 1530
[155; 159[ 12 157 1884
[159; 163[ 11 161 1771
[163; 167[ 7 165 1155
[167; 171[ 10 169 1690
Total 50 8030
Donc la taille moyenne est :
8030
X = = 160.6 cm
50

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Propriétés :
Si on pose le changement de variables Y = ϕ(X ), alors
k
1X
Y = ni ϕ(xi )
N
i=1

les xi représentent les valeurs des modalités dans le cas


discret ou les centres des classes dans le cas continu.
En particulier, si on pose le changement de variables
affine Y = aX + b, alors on a Y = aX + b
La somme algébrique des écarts à la moyenne
k
X
arithmétique est nulle : ni (xi − X ) = 0
i=1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Si une population P de taille N est composée de m


sous-populations P1 , P2 , . . . , Pm , de tailles respectives
N1 , N2 , . . . , Nm et de moyennes respectives
X 1 , X 2 , . . . , X m . Alors la moyenne X de la population P
est donnée par :
m
1X
X = Ni X i
N
i=1

Si X et Y sont deux caractès définis sur une même


population P, alors :

X +Y =X +Y

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

2- Le mode

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Définition
Le mode d’une distribution statistique, noté Mo , est la valeur
du caractère qui admet le plus grand effectif (ou la plus grande
fréquence).

C’est la valeur du caractère la plus fréquente.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Remarque :
Le mode peut être calculé pour tous les types de
caractère.
Le mode d’un caractère continu appartient à la classe
modale qui correspond à l’effectif corrigé le plus élevé.
Une distribution statistique peut avoir plusieurs modes.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Détermination pratique :
Si le caractère est qualitatif ou quantitatif discret, le mode
s’obtient facilement à partir du tableau statistique.
a. Cas d’un caractère qualitatif :
Considérons l’exemple1 : Etat mécanique des voitures.
Etat Effectif Fréquence
Mécanique ni fi
Mauvais 7 0.1
Moyen 17 0.24
Bon 32 0.46
Excellent 14 0.2
Total 70 1

”Bon” est la modalité qui admet le plus grand effectif. Donc, le


mode est Mo = Bon.
1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

b. Cas d’un caractère discret :

Exemple
Considérons l’exemple2 (Nombre d’enfants par famille) :

Nombre d’enfants 0 1 2 3 4 5 6 7 8 Total


Effectif ni 4 10 12 8 5 4 4 2 1 50

2 est la valeur la plus fréquente. Donc le mode de cette


distribution statistique est Mo = 2 enfants.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

c. Cas d’un caractère continu :

Dans ce cas, on définit d’abord la classe modale qui


correspond à l’effectif corrigé le plus élevé.
La classe modale correspond donc à la classe dont le
rectangle sur l’histogramme a la hauteur la plus élevée.

Si [xi ; xi+1 [ est la classe modale (d’effectif corrigé hi ), alors on


détermine la valeur du mode Mo en tenant compte des
effectifs corrigés des deux classes adjacentes à la classe
modale par la méthode suivante :

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Histogramme

Effectif corrigé
Classe modale

hi


1

2
h
i−1
hi+1

xi xi+1 x
Mo

Mo − xi x − Mo
On a : = i+1
∆1 ∆2
1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

D’où :
∆1
Mo = xi + (xi+1 − xi )
∆1 + ∆ 2
avec

∆1 = hi − hi−1
∆2 = hi − hi+1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Exemple
Considérons l’exemple3 (Taille des femmes enceintes) :

Taille Effectif
(en cm) ni
[151; 155[ 10
[155; 159[ 12
[159; 163[ 11
[163; 167[ 7
[167; 171[ 10
Total 50

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Pour cet exemple, toutes les classes ont la même amplitude.


Donc, on n’a pas besoin d’utiliser les effectifs corrigés (on a :
hi = ni ).

La classe modale est : [155; 159[.


On a :
∆1 = 12 − 10 = 2
∆2 = 12 − 11 = 1
2
d’où Mo = 155 + 4 × = 157.66 cm
2+1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Exemple
Considérons l’exemple3 avec des classes qui n’ont pas la
même amplitude :

Taille Effectif Amplitude Eff. corrigé


(en cm) ni ai (en cm) hi
[151; 155[ 10 4 10
[155; 159[ 12 4 12
[159; 167[ 18 8 9
[167; 171[ 10 4 10
Total 50

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

La classe modale est [155; 159[ (c’est la classe qui admet le


plus grand effectif corrigé). On a :

∆1 = 12 − 10 = 2

∆2 = 12 − 9 = 3
Donc
2
Mo = 155 + 4 ×
2+3
Le mode de cette distribution est donc :

Mo = 156.6 cm

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Détermination graphique du mode : On peut déterminer le


mode graphiquement par une lecture sur l’histogramme.
15
Effectif corrigé hi
(C=4)

10

0
151 155 Mo 159 163 167 171 Taille

Figure: Détermination graphique du mode.


1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

3- La médiane

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Définition
La médiane d’une distribution statistique, ordonnée par ordre
croissant, notée Me , est la valeur du caractère qui partage la
population en deux sous populations de même effectif :
50% de la population ont des valeurs du caractère ≤ Me et
50% de la population ont des valeurs du caractère ≥ Me .

N
Autrement dit, on doit avoir G(Me ) = 2 ou F (Me ) = 12 .

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Détermination pratique :

a. Cas d’un caractère discret :


Soit {(xi , ni )1≤i≤k } une distribution statistique discrète
ordonnée : x1 < x2 < · · · < xk
et soient N1 , N2 , . . . , Nk les effectifs cumulés correspondants.
On a Ni = G(xi ).

La fonction de répartition G(x) n’est pas continue (fonction en


escalier). Donc, il n’existe pas, en général, une valeur Me telle
que G(Me ) = N2 .

Dans ce cas, on considère que la médiane est la plus petite


valeur Me telle que G(Me ) > N2 .

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Ainsi, on distingue deux cas :


1er cas : Ni−1 < N2 < Ni (pas de solution pour G(x) = N2 ).
Dans ce cas, on prend la médiane égale à la modalité
d’effectif cumulé Ni (c’est la plus petite modalité d’effectif
cumulé > N2 ) :
Me = xi
L’interprétation de la médiane, dans ce cas, sera :
Plus de 50% de la population ont des valeurs ≤ Me et plus
de 50% de la population ont des valeurs ≥ Me .

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

2ème cas : N2 = Ni (toute valeur x comprise entre xi et


xi+1 vérifie G(x) = N2 ).
Dans ce cas, on prend la médiane égale à la valeur
centrale entre les deux modalités xi et xi+1 :

1
Me = (xi + xi+1 )
2
L’interprétation de la médiane, dans ce cas, sera :
50% de la population ont des valeurs < Me et 50% de la
population ont des valeurs > Me .

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Exemple
Considérons l’exemple2 (Nombre d’enfants par famille) :

Nombre d’enfants 0 1 2 3 4 5 6 7 8 Tota


Effectif ni 4 10 12 8 5 4 4 2 1 50
Eff. Cum. Ni 4 14 26 34 39 43 47 49 50

On a 14 < N2 = 25 < 26 = G(2) :


N
2 est la plus petite valeur telle que l’effectif cumulé dépasse 2.
Donc la médiane de cette distribution statistique est Me = 2
enfants.

Interprétation : Plus de 50% des familles (26 familles) ont le


nombre d’enfants ≤ 2 et plus de 50% des familles (36 familles)
ont le nombre d’enfants ≥ 2.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Remarque :
On a le même raisonement avec les fréquences cumulées :
Si Fi−1 < 0.5 < Fi , alors la médiane est la modalité de
fréquence cumulée Fi :

Me = xi

Si 0.5 = Fi , alors la médiane est la valeur centrale entre


les deux modalités de fréquence cumulée respectives Fi
et Fi+1 :
1
Me = (xi + xi+1 )
2

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Détermination graphique de la médiane : On peut déterminer


la médiane graphiquement par une lecture sur le diagramme
en escalier.
G(x)
N= 50

40

30
N/2

20

10

0 x
0 1 2 3 4 5 6 7 8

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

b. Cas d’un caractère continu :


Pour un caractère continu, la médiane est la valeur Me telle
que : G(Me ) = N2 (ou F (Me ) = 0.5).

Soit {([xi ; xi+1 [, ni )1≤i≤k } une distribution statistique continue.


On a :

G(xi+1 ) = Ni et F (xi+1 ) = Fi , pour 1 ≤ i ≤ k

G(x1 ) = F (x1 ) = 0
avec Ni (resp. Fi ) est l’effectif (resp. la fréquence) cumulé(e)
de la classe [xi ; xi+1 [, 1 ≤ i ≤ k.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

On commence d’abord par chercher la classe médiane


[xi ; xi+1 [ : C’est la première classe pour laquelle l’effectif
cumulé dépasse N2 (ou la fréquence cumulée dépasse 0.5).

N
Me ∈ [xi , xi+1 [ ⇔ G(xi ) ≤ < G(xi+1 ) ⇔ F (xi ) ≤ 0.5 < F (xi+1 )
2

La valeur de la médiane s’obtient ensuite par interpolation


linéaire, en raison de l’hypothèse d’équirépartition à l’intérieur
des classes :

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

G(x) F(x)
Diagramme cumulatif Diagramme cumulatif

Ni Fi

N/2 0.5

Ni−1 Fi−1

x Me x x x Me x x
i i+1 i i+1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

On a :
Me − xi N/2 − G(xi ) 1/2 − F (xi )
= =
xi+1 − xi G(xi+1 ) − G(xi ) F (xi+1 ) − F (xi )

D’où
N/2 − G(xi )
Me = xi + (xi+1 − xi )
G(xi+1 ) − G(xi )
ou bien
0.5 − F (xi )
Me = xi + (xi+1 − xi )
F (xi+1 ) − F (xi )

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Exemple
Considérons l’exemple3 (Taille des femmes enceintes) :

Taille Effectif Eff. cum. Fréquence Fréq. cum.


(en cm) ni Ni fi Fi
[151; 155[ 10 10 0.2 0.2
[155; 159[ 12 22 0.24 0.44
[159; 163[ 11 33 0.22 0.66
[163; 167[ 7 40 0.14 0.8
[167; 171[ 10 50 0.2 1
Total 50 1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

N
On a 2 = 25. Donc la classe médiane est :

Me ∈ [159, 163]

et on a :
G(159) = 22
G(163) = 33
d’où
25 − 22
Me = 159 + (163 − 159) = 160.09 cm
33 − 22

Interprétation : 50 % des femmes ont une taille ≤ 160.09 cm


et 50 % des femmes ont une taille ≥ 160.09 cm.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Détermination graphique :

50

40

30
N/2

20

10

0
151 155 159 163 167 171
M
e

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
1- La moyenne
III.2- Paramètres de position
2- Le mode
III.3- Paramètres de dispersion
3- La médiane
III.4- Paramètres de dispersion relative

Remarque : Symétrie d’une distribution statistique

La médiane est fréquemment comprise entre la moyenne et le


mode.
Si la distribution statistique est symétrique, ces trois
paramètres de tendance centrale seront confondues.

En général, on a :
Mo = Me = X si et seulement si la distribution est symétrique
si Mo < Me < X , alors la distribution est étalée vers la droite
si X < Me < Mo , alors la distribution est étalée vers la gauche

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

III.2- Paramètres de position

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

On vient de définir la médiane comme un paramètre de


tendance centrale. C’est une valeur centrale qui permet de
partager la population en deux groupes de même effectif.

On verra dans la suite que la médiane est aussi un paramètre


de position. On dit que la médiane est un paramètre de
position d’ordre p = 12 .

En général, on définit un paramètre de position d’ordre p


(0 < p < 1) comme étant une valeur qui permet de partager la
population de taille N en deux groupes de taille respectives
p × N et (1 − p) × N.

Ainsi, la notion de paramètres de position généralise celle de


la médiane.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

Définition
Un paramètre de position d’ordre p (0 < p < 1) d’un caractère
statistique X , (appelé aussi quantile ou fractile d’ordre p), est
la valeur du caractère, notée Zp , qui permet de partager la
population de taille N en deux groupes de tailles respectives
p × N et (1 − p) × N et telle que : le premier groupe est formé
des individus qui ont des valeurs du caractère ≤ Zp et le
deuxième groupe est formé des individus qui ont des valeurs
du caractère ≥ Zp .

Ainsi, Zp doit vérifier F (Zp ) = p ou bien G(Zp ) = p × N.

Dans la suite de ce paragraphe, on va décrire les paramètres


de position les plus fréquemment utilisés qui sont les quartiles,
les déciles et les centiles.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

1. Les quartiles
Définition
Les quartiles sont définis comme étant les trois paramètres de
position, notés Q1 , Q2 , Q3 , d’ordre resectifs 0.25, 0.5, 0.75,
qui permettent de diviser la population en quatre groupes de
même effectif (contenant chacun 25% des individus).

On a :
Q1 = Z0.25 , Q2 = Z0.5 , Q3 = Z0.75

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

Remarque
25% de la population ont des valeurs ≤ Q1 et 75% de la
population ont des valeurs ≥ Q1 .
75% de la population ont des valeurs ≤ Q3 et 25% de la
population ont des valeurs ≥ Q3 .
25% de la population ont des valeurs comprises entre Q1
et Q2 et 25% de la population ont des valeurs comprises
entre Q2 et Q3
Le deuxième quartile Q2 coı̈ncide donc avec la médiane
Me .

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

2. Les déciles et les centiles

Quelques fois, on cherchera à diviser une population en dix ou


en cent groupes contenant chacun le même pourcentage
d’individus.

Dans le cas où on veut découper la population en dix groupes,


on utilise les déciles qui sont définis comme étant les 9
paramètres de position, notés D1 , D2 , . . . , D9 , d’ordre
resectifs 0.1, 0.2, . . . , 0.9.

Dans le cas où on veut découper la population en cent


groupes, on utilise les centiles, notés C1 , C2 , . . . , C99 , d’ordre
resectifs 0.01, 0.02, . . . , 0.99.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

Remarque
On a :

D1 = Z0.1 , D2 = Z0.2 , ..., D9 = Z0.9

C1 = Z0.01 , C2 = Z0.02 , ..., C99 = Z0.99


Entre deux déciles consécutifs, il y a 10% des individus de
la population.
Entre deux centiles consécutifs, il y a 1% des individus de
la population.
Le 5ème décile D5 et le 50ème centile C50 coı̈ncident
avec la médiane Me .

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

Détermination pratique :

Le calcul et l’interprétation d’un paramètre de position d’ordre


p se font de manière similaire que pour la médiane. Il suffit de
remplacer 1/2 par p.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

a. Cas d’un caractère discret :

Comme pour la médiane, il n’existe pas, en général, une


valeur Zp telle que G(Zp ) = p × N (ou F (Zp ) = p).

On considère alors que le paramètre de position d’ordre p est


la plus petite valeur Zp telle que G(Zp ) ≥ p × N (ou F (Zp ) ≥ p).

Ainsi, au moins (100 × p)% de la population ont des valeurs ≤


à Zp et au moins (100 × (1 − p))% de la population ont des
valeurs ≥ à Zp .

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

On distingue deux cas :


Si Ni−1 < p × N < Ni , alors on prend Zp égal à la modalité
d’effectif cumulé Ni :
Zp = xi
Si p × N = Ni , alors on prend Zp égal à la valeur milieu
entre les deux modalités d’effectifs cumulés respectifs Ni
et Ni+1 :
1
Zp = (xi + xi+1 )
2

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

Exemple2 :

Nombre Effectif Eff. cum.


d’enfants ni Ni
0 4 4
1 10 14
2 12 26
3 8 34
4 5 39
5 4 43
6 4 47
7 2 49
8 1 50

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

Q1 = Z0.25 = 1, (4 < p × N < 14)

Me = Q2 = Z0.5 = 2, (14 < p × N < 26)

Q3 = Z0.75 = 4, (34 < p × N < 39)

D1 = Z0.1 = 1, (4 < p × N < 14)

C1 = Z0.01 = 0, (0 < p × N < 4)

(0 + 1)
C8 = Z0.08 = = 0.5, (p × N = 4)
2

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

Interprétation :

Au moins 25 % des familles ont un nombre d’enfants ≤ 1 et au


moins 75% des familles ont un nombre d’enfants ≥ 1.

8% des familles ont un nombre d’enfants < 0.5 et 92 % des


familles ont un nombre d’enfants > 0.5.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

Remarque :
On a le même raisonement avec les fréquences cumulées :
Si Fi−1 < p < Fi , alors

Zp = xi

Si p = Fi , alors
1
Zp = (xi + xi+1 )
2

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

Détermination graphique :

G(x)
N= 50

40
3N/4
0.68N
30
N/2

20

N/4
10

0 x
0 1 2 3C 4 5 6 7 8
68
Q1 Me Q3

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

b. Cas d’un caractère continu :

Pour un caractère continu, le paramère Zp est telle que


G(Zp ) = p × N (ou F (Zp ) = p).

Comme pour la médiane, on commence d’abord par chercher


la classe [xi , xi+1 [ qui contient le quantile Zp . C’est la première
classe pour laquelle l’effectif cumulé dépasse p × N (ou la
fréquence cumulée dépasse p).

Zp ∈ [xi , xi+1 [ ⇔ G(xi ) ≤ p×N < G(xi+1 ) ⇔ F (xi ) ≤ p < F (xi+1 )

La valeur du quantile Zp s’obtient ensuite par interpolation


linéaire :

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

On a :
Zp − xi p × N − G(xi ) p − F (xi )
= =
xi+1 − xi G(xi+1 ) − G(xi ) F (xi+1 ) − F (xi )

D’où
p × N − G(xi )
Zp = xi + (xi+1 − xi )
G(xi+1 ) − G(xi )
ou bien
p − F (xi )
Zp = xi + (xi+1 − xi )
F (xi+1 ) − F (xi )

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

Exemple3 :

Taille Effectif Eff. cum. Fréquence Fréq. cum.


(en cm) ni Ni fi Fi
[151; 155[ 10 10 0.2 0.2
[155; 159[ 12 22 0.24 0.44
[159; 163[ 11 33 0.22 0.66
[163; 167[ 7 40 0.14 0.8
[167; 171[ 10 50 0.2 1
Total 50 1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

5−0
D1 = 151 + 4 = 153 cm
10 − 0
12.5 − 10
Q1 = 155 + 4 = 155.83 cm
22 − 10
37.5 − 33
Q3 = 163 + 4 = 165.57 cm
40 − 33
45 − 40
D9 = 167 + 4 = 169 cm
50 − 45

Interprétation : 10 % des étudiants ont une taille ≤ 153 cm et


90 % des étudiants ont une taille ≥ 153 cm.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

Détermination graphique :

50
0.9×N

40
0.75×N

30

20

0.25×N
10
0.1×N

0
151 D 155 Q 159 163 Q 167
1 1 3
D 171 9

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position
III.3- Paramètres de dispersion
III.4- Paramètres de dispersion relative

Remarque

En utilisant les quartiles Q1 et Q3 , on peut détecter l’existence


des valeurs aberrantes dans une série statistique. Pour cela,
on calcule les deux limites :

Linf = Q1 − 1.5 × (Q3 − Q1 )

Lsup = Q3 + 1.5 × (Q3 − Q1 )


Toute donnée qui ne se trouve pas entre ces deux limites est
jugée aberrante.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

III.3- Paramètres de dispersion

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

Les paramètres de tendance centrale et de position ne


donnent pas une information complète sur une distribution
statistique.

Deux séries statistiques qui ont les mêmes paramètres de


tendance centrale ou de position peuvent présenter des
variations des valeurs (des dispersions) très différentes.

Exemple : Considérons les 2 séries statistiques suivantes :


Série 1 : 7, 8, 11, 12, 13, 13, 13
Série 2 : 4, 7, 9, 12, 13, 13, 19

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

Ces 2 séries ont les mêmes valeurs de tendance centrale,


donc si on se base seulement sur ces mesures, on va conclure
à une similitude de ces deux séries et donc on perd de vue la
variabilité des données autour de ces mesures centrales.

D’où la nécessité de définir des paramètres de dispersion qui,


associés aux paramètres de tendance centrale, vont nous
donner une idée plus exacte sur la distribution statistique.

Dans ce paragraphe, on va décrire quelques uns de ces


paramètres de dispersion.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

1- L’étendue

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

Définition
L’étendue d’un caractère statistique X , noté E(X ), est la
différence entre la plus grande valeur et la plus petite valeur
observées :
E(X ) = Max(xi ) − Min(xi )

Ce paramètre présente un intérêt très limité du fait qu’il


dépend uniquement des valeurs extrêmes, qui peuvent être
des valeurs exceptionnelles ou aberrantes.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

2- L’étendue interquantiles

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

Définition
A partir des quartiles Q1 et Q3 , on peut définir un paramètre
de dispersion, appelé étendue interquartiles, défini par :

∆Q = Q3 − Q1

De même, on peut définir un paramètre de dispersion, appelé


étendue interdéciles, défini par :

∆D = D9 − D1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

Remarque
Le calcul de l’étendue interquantiles a l’avantage par
rapport à celui de l’étendue d’éviter les valeurs extrêmes.
L’intervalle interquartiles [Q1 , Q3 ] contient 50% des
observations.
L’intervalle interéciles [D1 , D9 ] contient 80% des
observations.
Plus l’intervalle interquantiles est large, plus la série est
dispersée.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

3- Ecart absolu moyen

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

Définition
L’écart absolu moyen d’un caractère statistique X , noté Em (X ),
est la moyenne arithmétique des valeurs absolues des écarts
à la moyenne :
k
1X
Em (X ) = ni |xi − X |
N
i=1

les xi représentent les modalités dans le cas discret ou les


centres des classes dans le cas continu.

Ce paramètre est peu maniable à cause des valeurs absolues.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

4- Variance, Ecart-type

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

Définition
La variance d’un caractère statistique X , notée V (X ), est la
moyenne arithmétique des carrés des écarts à la moyenne :
N k
1X 1X
V (X ) = (x(i) − X )2 = ni (xi − X )2
N N
i=1 i=1

Définition
L’écart-type, noté σ(X ), est la racine carrée de la variance :
p
σ(X ) = V (X )

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

Formule simplifiée de la variance :


Proposition

On a :
2
V (X ) = X 2 − X
La variance est égale à la différence entre la moyenne des
carrées (moyenne quadratique) et le carré de la moyenne.

N k
1X 2 1X
X2 = x(i) = ni xi2
N N
i=1 i=1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

Les xi représentent les modalités dans le cas discret ou les


centres des classes dans le cas continu.

Les x(i) représentent les valeurs individuelles du caractère X .

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

Remarques :
l’écart-type est le meilleur indicateur de la dispersion
d’une série statistique par rapport à sa moyenne. Elle
tient compte de toutes les valeurs de la série statistique.

plus l’écart-type est faible, plus les valeurs du caractère


sont concentrées autour de la moyenne.

plus l’écart-type est élevé, plus les valeurs du caractère


sont dispersées autour de la moyenne.
La variance (ou l’écart-type) est nulle si et seulement si
toutes les valeurs sont identiques et égales à la moyenne.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

Propriétés :

Si on pose Y = aX + b (a et b deux constantes) alors :

V (Y ) = a2 V (X )

σ(Y ) = |a|σ(X )

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

Exemple : Distribution des salaires.

ci − 6500
Salaire (X ) ci ni yi = ni yi ni yi2
1000
[3000, 5000[ 4000 26 -2.5 -65 162.5
[5000, 6000[ 5500 33 -1 -33 33
[6000, 7000[ 6500 64 0 0 0
[7000, 8000[ 7500 7 1 7 7
[8000, 10000[ 9000 10 2.5 25 62.5
Total 140 -66 265

X − 6500
On effectue le changement de variables Y = pour
1000
simplifier les calculs :

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale 1- L’étendue
III.2- Paramètres de position 2- L’étendue interquantiles
III.3- Paramètres de dispersion 3- Ecart absolu moyen
III.4- Paramètres de dispersion relative 4- Variance, Ecart-type

5
1X 66
Y = ni yi = −
N 140
i=1

⇒ X = 1000Y + 6500 = 6028.57

5
1X 2 265 66 2
V (Y ) = ni yi2 − Y = −( ) = 1.670612
N 140 140
i=1

⇒ V (X ) = 10002 V (Y ) = 1670612

p
⇒ σ(X ) = V (X ) = 1292, 52

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position 1- Coefficient de variation
III.3- Paramètres de dispersion 2- Etendue interquantiles relative
III.4- Paramètres de dispersion relative

III.4- Paramètres de dispersion


relative

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position 1- Coefficient de variation
III.3- Paramètres de dispersion 2- Etendue interquantiles relative
III.4- Paramètres de dispersion relative

La dispersion mesurée par les paramètres présentés


précédemment est qualifiée d’absolue. Elle s’exprime dans
l’unité de mesure du caractère.

Par exemple, si on considère l’écart-type d’une série


statistique, l’importance du degré de variabilité que cela
suggère dépend de la valeur de la moyenne de cette série.

Pour remédier à cette difficulté d’interprétation de la dispersion


et/ou pour comparer la dispersion de deux séries statistiques
ayant des unités différentes ou des ordres de grandeur
différents, il est nécessaire de considérer une mesure de
dispersion relative.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position 1- Coefficient de variation
III.3- Paramètres de dispersion 2- Etendue interquantiles relative
III.4- Paramètres de dispersion relative

1- Coefficient de variation

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position 1- Coefficient de variation
III.3- Paramètres de dispersion 2- Etendue interquantiles relative
III.4- Paramètres de dispersion relative

Définition
Le coefficient de variation d’une variable statistique X , noté
Cv (X ), est défini par :

σ(X )
Cv (X ) =
X
Il s’agit d’un nombre sans unité.

Plus le coefficient de variation est élevé, plus la dispersion


autour de la moyenne est élevée et plus l’homogénéité est
faible.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position 1- Coefficient de variation
III.3- Paramètres de dispersion 2- Etendue interquantiles relative
III.4- Paramètres de dispersion relative

2- Etendue interquantiles
relative

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position 1- Coefficient de variation
III.3- Paramètres de dispersion 2- Etendue interquantiles relative
III.4- Paramètres de dispersion relative

On peut définir d’autres mesures de dispersion relative en


utilisant les quartiles et les déciles.
Définition
Etendue interquartiles relative :

Q3 − Q1
Me

Etendue interdéciles relative :


D9 − D1
Me

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position 1- Coefficient de variation
III.3- Paramètres de dispersion 2- Etendue interquantiles relative
III.4- Paramètres de dispersion relative

Remarque

Ces paramètres (nombres sans unité) permettent de comparer


les dispersion (ou l’homogénéité) d’un ou de plusieurs
caractères sur une ou plusieurs populations.

Plus un paramètre relatif est élevé, plus la dispersion est


élevée et plus l’homogénéité est faible.

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI
III.1- Paramètres de tendance centrale
III.2- Paramètres de position 1- Coefficient de variation
III.3- Paramètres de dispersion 2- Etendue interquantiles relative
III.4- Paramètres de dispersion relative

Fin chapitre 1

1ère partie : STATISTIQUE DESCRIPTIVE - Chapitre 1 Module M147 - MIP Pr. A. FAHSI

Vous aimerez peut-être aussi