Caractéristique Des Distributions Statistiques

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 9

Caractéristique des distributions statistiques

Uni-variées

-indicateur de tendance centrale : Mode, Médiane et Moyenne


-indicateurs de distribution : Etendu, Variance, Ecart-type,
coefficient de variation.

Réalisée par : Dr. MOUSSAOUI

CARACTERISTIQUES DES DISTRIBUTIONS


STATISTIQUES UNIVARIEES

L’étude d’une variable statistique quantitative fait souvent


l’objet de l’utilisation des indicateurs de synthèses numériques. Cela
nous amène à s’intéresser dans le présent chapitre à la présentation des
indicateurs de tendance centrale (ou de position) et de dispersion.

3-1- Caractéristiques de tendance centrale :


Les trois caractéristiques de tendance centrale les plus utilisées
sont : Le mode, la médiane et la moyenne arithmétique. On peut leur
ajouter les quartiles et les centiles ainsi que les moyennes géométrique
et harmonique dont l’usage s’impose dans certains cas particuliers.
3-1-1- La moyenne arithmétique simple:

C’est l’indicateur qui permet de situer (repérer) la valeur moyenne


d’une série statistique. Elle est égale à la somme des valeurs prises par
cette variable divisée par le nombre d’observation :

Soit une variable statistique Xi qui peut prendre les valeurs x1,…..,xk
auxquelles correspondent
respectivement les effectifs n1,…..,nk ; la moyenne arithmétique
pondérée est :
∑ = [ ] ∑
*Formulation de la moyenne avec les fréquences relatives:

∑ = ʄ x +ʄ x +…+ʄixi

Ou ʄi= ; ∑ ʄ =1

Exemple : Considérons la série suivante :


7, 7, 8, 8, 8, 10, 10, 10,12
Calculer La moyenne arithmétique simple et pondérée ?
* La moyenne arithmétique simple :
* La moyenne arithmétique pondérée : =9

3-1-2- Le mode : C'est la valeur dominante ou la réponse la plus


souvent rencontrée dans une distribution statistique d’une variable
quantitative.

Exemple :
Une entreprise, dans le domaine pharmaceutique, veut lancer
la fabrication d'un médicament dans un marché qu’elle ne maitrise
pas. Il sera souhaitable pour elle de se lancer, dans un premier temps,
dans la fabrication d’un produit de large consommation, ensuite, elle
s’orientera vers d’autre produits en fonction de la population ciblée.
a- Le mode pour le cas discret :
Le mode est la modalité (xi) telle que la fréquence (fi) correspondante
est la plus élevée. On le note Mo.
Exemple : Dans une PME, on a comptabilisé pendant un an le nombre
de jours d’absence pour l’arrêt-maladie de chacun des 12 employés.
On s’intéresse au nombre de jours d’absence le plus demandé.

Tableau 1 : La distribution du nombre de jours d’absence pour


l’arrêt-maladie
Nb jours 0 3 5 7 8 11 13
d’absence
Effectif ni 1 4 2 1 1 2 1

Le mode est de : MO = 3 jours

Remarque : il se peut que dans certains cas l’effectif maximal se


répète deux ou plusieurs fois pour différente valeur de la variable. On
parle alors de distribution à deux modes (bimodale) ou à plusieurs
modes (plurimodales).

b- mode pour le cas continu :


Dans le cas continue, on parle de la classe modale [ai, ai+1], c’est la
classe correspondante au plus grand effectif. Pour déterminer la valeur
du Mode qui appartient à cette classe on utilise la formule suivante :

Mo=L1 +A [Δ1/ (Δ1+Δ2)]

Où :

* L1: borne inférieure de la classe modale.


* Δ1 ni – ni-1: excédent d’effectif de la classe modale à l’effectif de
la classe précédente.
* Δ2 ni – ni+1: excèdent d’effectif de la classe modale à l’effectif de
la classe suivante.
* A =ai+1–ai : amplitude de la classe modale.
Exemple :
Déterminons le mode pour des données portant sur une variable
quantitatives continues qui la répartition du salaire mensuel moyen de
33 employés d’une entreprise de l’année 2000.

Tableau 2 : Distribution du salaire mensuel moyen en milliers de DA


[ai-1 ai [ ni
[10 20[ 7
[20 30[ 10
[30 40[ 15
[40 50[ 3
Total n=35

La classe modale est : [30 - 40[, c’est la classe l’effectif le plus élevé.

Le mode Mo 30 + 10 [5 ⁄ (5+12)] 30+ 2,94 33

3-1-3- La médiane :

On appelle médiane d’une distribution, et on note "Me" la


valeur de la variable partageant les observations classées par ordre
croissant en deux groupes de même effectifs (50%).

a- La médiane pour le cas discret :

● Données non groupées : Pour déterminer la médiane il faut, tout


d’abord, ordonner les effectifs (ou les fréquences) par ordre croissant
ou décroissant. Ensuite, la médiane est la valeur de la variable située
au milieu.

Remarque :

□ Si le nombre d’observateur "n" est impair, la médiane est la valeur


située à la position
(n+1)/2 ;
□ Si le nombre d’observateur n est pair, la médiane se trouve à
l’intérieur de l’intervalle médian compris entre les deux valeurs
centrales situées aux positions n/2 et (n/2) +1.

Exemple :

Le tableau ci-dessous donne la distribution d’un groupe de neuf


ménages selon le nombre de personne par ménage "n" est impair. La
variable statistique est le “nombre de personne par ménage“.

Tableau 3 : Distribution du nombre de personne par ménage


N° du ménage 1 2 3 4 5 6 7 8 9
Nombre de personne 3 1 4 6 2 4 3 5 7
En ordonnant la série suivant les valeurs croissantes, on obtient :

Tableau 3-1 : Classement du nombre de personne par ménage par


ordre croissant.

N° du ménage 2 5 1 7 3 6 8 4 9
Nombre de personne 1 2 3 3 4 4 5 6 7
4Valeurs Me 4Valeurs
La médiane Me = 4

Interprétation1 : Il y a autant de ménages composés de moins de 4


personnes que de ménages composés de plus de 4 personnes.

Exemple : Examinons le cas où la taille de l’échantillon est paire (12


ménages).

Tableau 4 : Distribution statistique de 12 ménages par rapport au


nombre de personnes
N° du ménage 1 2 3 4 5 6 7 8 9 10 11 12
Nombre de personne 5 3 2 3 6 3 5 4 7 2 1 4

1
La signification de la médiane est de plus en plus intéressante quand on travaille sur des échantillons de taille
importante.
On ordonne la série la série par ordre croissant selon le nombre de
personnes par ménage.

Tableau 4-1 : Classement du nombre de personne par ménage par


ordre croissant.
N° du ménage 11 3 10 2 4 6 8 12 1 7 5 9
Nombre de personne 1 2 2 3 3 3 4 4 5 5 6 7
5Valeurs Intervalle 5Valeurs
Médian

La médiane se situe entre la sixième et la septième position.


La moyenne de ces deux valeurs :
Me= (3+4)/2=3,5 4

● Données groupées : Elle se détermine à partir des fréquences


cumulées ou des effectifs cumulés.
Exemple :

Soit la distribution du nombre d’article vendu dans un magasin


microordinateurs par jours pendant 3534 jours.

Tableau 5 : Distribution des ventes des microordinateurs par jours


Valeur xi Effectif Effectifs Fréquences
cumulés cumulées
1 191 191 5.4
2 625 816 23.1
3 1293 2109 59.7
4 1084 3193 90.4
5 1084 3534 100.0
Total 3534
Le nombre de jours est pair, donc la moitié de l’effectif total est :
3534/2 = 1767.
Me= 3, cette modalité correspond à la fréquence cumulée qui associée
à 50 % ou à celle qui vient après 50%.
b- La médiane pour le cas continu :
Elle se détermine à partir des fréquences cumulées, ou d’effectifs
cumulés.
On procède en premier lieu au calcul des effectif cumulé, ensuite
on détermine la classe médiane ; c’est la classe correspond au 50% des
effectif ou celle qui vienne après.
Pour calculer la valeur approximative de la médiane, on utilise la
formule suivante :

[∑ ]
Me = L1 +[ ]

Tel que :
L1 : la borne inférieure de la classe médiane
Mn-1 : l’Effectif cumulé croissant (ECC) précédente de la classe
intermédiaire
Esme : Effectif de la classe médiane
A : A =ai+1–ai : amplitude de la classe médiane.

Exemple :
Déterminons le mode pour des données portant sur une variable
quantitatives continues qui la répartition du salaire mensuel moyen de
33 employés d’une entreprise de l’année 2000.

Tableau 6 : Distribution du salaire mensuel moyen en milliers de DA


[ai-1 ai [ ni ECC
[10 20[ 7 7
[20 30[ 10 17
[30 40[ 15 32
[40 50[ 3 35
Total n=35
La classe médiane est : [30 - 40[, c’est la classe l’effectif le plus élevé.
n/2=35/2=17,5 ; l’Effectif cumulé croissant (ECC) précédente de la
classe intermédiaire Mn-1 =17 ; Effectif de la classe médiane Esme=15
A=40-30=10
[∑ ]
La médiane Me = 30 + [ ]. 10 =30,33

3-2- CARACTERISTIQUES DE DISPERSION :


Les caractéristiques de dispersion les plus fréquentes utilisées sont :
l’étendue, l’écart absolu moyen, la variance, l’écart-type et le
coefficient de variation.

3-2-1- L’étendue :
L’étendue est la différence entre la plus petite valeur et la plus grande
valeur d’une distribution statistique.

W=max (xi) - min (xi)

Exemple : Considérons les deux séries suivantes :


Xi=8, 9,9, 10, 10, 10, 11, 11,12
Yi=1, 3, 3, 10, 10, 10, 17, 17,19

On peut imaginer, par exemple, que Xi et Yi sont les notes


d’espagnol des groupes A et B respectivement. Les deux séries ont
même moyenne arithmétique (10), même médiane (10) et même mode
(10). Cependant, on constate que ces séries sont très différentes : les
valeurs de la première sont fortement concentrées autour de 10, alors
que la deuxième présente une forte variabilité. Cette dernière, appelée
dispersion, il est donc le complément indispensable à la moyenne pour
un résume numérique d’une distribution statistique.

Pour les deux séries précédentes, on a :

Wx =12-8=4 et Wy = 19-1=18

On considère la distribution de la série Zi dont les valeurs sont :


Zi= 1,10,10,10,10,10,10,10,10,10,10,10,10,10,19

L’étendue de cette série est également 18, mais la variabilité est


très différente on voit ici la limite de cette notion, c’est à dire qu’elle
ne prend en compte que les deux valeurs extrêmes et ignore
totalement les autres valeurs.

3-2-2- Variance et écart-type :

Considérant la série Xi = {x1 …. xp} avec les effectifs respectifs {n1…


.np } vérifiant n1 +…+ np = n.

La variance de cette série est la moyenne arithmétique des carrées des


écarts à la moyenne arithmétique.

V(x)= ∑

V(x)=∑ ʄ ̅

Quat à son interprétation, il faut calculer l’écart type.


L’écart-type est égal à la racine carrée de la variance :
=√
*La formule développée de la variance :
V(x)= ∑
=√

Exemple : Soient les trois séries suivantes X, Y et Z :


X : 6, 8, 10, 12,14
Y : 8, 9, 10, 11,12
Z : 0, 5, 10, 15,20
Il est aisé de voir que la moyenne arithmétique est égale à 10 pour
chacune de ces trois séries, mais l’écart-type est respectivement :

V(x) 8, donc l’écart-type sera 2,828.


V(Y) 2, donc l’écart-type sera 1,414.
V(Z) 50, donc l’écart-type sera 7,071.

Vous aimerez peut-être aussi