Bivariée

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 37

Statistiques Descriptives

(Analyse bivariée )

Animé par : Pr AIT BABRAM Mohamed

2008/2009
FSTG Marrakech
Plan du chapitre

I. Introduction
II. Formulation de la méthode
Analyse Bivariée

III. Cas de deux variables qualitatives


IV. Cas d’une variable qualitatives et d’une
variable quantitative
V. Cas de deux variables quantitatives
Pr. AIT BABRAM Mohamed
FSTG Marrakech Introduction
Dans le processus de décision ou comme support à l’aide à la décision ou dans le
cadre d’une expérimentation technologique, il arrive fréquemment que les
conclusions et les recommandations soient basées sur l’existence d’une liaison
d’ordre fonctionnelle ou statistiques entre deux ou plusieurs variables.

Exemple: Le responsable de la mise en marché d’une entreprise, après avoir établi


une relation entre les dépenses en publicité et le volume des ventes, peut effectuer
une prévision du volume des ventes selon un niveau de dépenses en publicité.
Analyse Bivariée

Dans la suite de ce chapitre, on traitera du cas où l’on dispose de deux caractères


X et Y observés sur les mêmes individus. Plusieurs cas de figures sont
envisageables :

Variable X explicative
Quantitatif Qualitatif
Pr. AIT BABRAM Mohamed

Quantitatif - Régression simple Analyse de la variance


Variable Y - Corrélation simple à un facteur
expliquée
Qualitatif Régression logistique Test du khi-deux
d'indépendance
FSTG Marrakech

Formulation de la méthode

1. Tableau de contingence
2. Distribution marginale.
Analyse Bivariée

3. Distribution conditionnelle.
4. Indépendance de deux
caractères.
5. Exemples
Pr. AIT BABRAM Mohamed
FSTG Marrakech Tableau de contingence
Nous prélevons d’une population un échantillon aléatoire de taille n et nous
observons sur chaque unité statistique de l’échantillon deux caractères X et Y
qui peuvent êtres quantitatifs, qualitatifs ou encore l’un est qualitatif et
l’autre est quantitatif.
¾ X présente k modalités x1, x2, …….., xk.
¾ Y présente m modalités y1, y2, …….., yk.
Analyse Bivariée

La répartition des n observations suivant les modalités croisées des deux


caractères se présente sous la forme d’un tableau à double entrée appelé
aussi tableau de contingence. La structure d’un tel tableau est comme suite :
Désigne l’effectif des unités de la
populations étudiée qui présentent à la fois
la modalité xi de X et la modalité yj de Y.

Désigne l’effectif des unités de la


Pr. AIT BABRAM Mohamed

populations étudiée qui présentent la


modalité xi de X.

Désigne l’effectif des unités de la


populations étudiée qui présentent la
modalité yj de Y.

k m
n• j = ∑n ij ni • = ∑n
i =1
ij
i =1
FSTG Marrakech
Tableau de contingence
Remarque : Un tableau de contingence peut être aussi formulé avec des
fréquences relatives ou bien des pourcentages.
Analyse Bivariée
Pr. AIT BABRAM Mohamed

m m
fi• = ∑ f ij pi • = ∑ pij
j =1 j =1

k
n ij k
f ij = f • j = ∑ f ij pij = f ij ×100 p• j = ∑ pij
n i =1 i =1
k m k m

∑f i• = ∑ f• j = 1 ∑p
i =1
i• = ∑ p• j = 100
j =1
i =1 j =1
FSTG Marrakech Tableau de contingence
Exemple 1 : les caractères X et Y (Qualitatifs)
A fin d’étudier le comportement des clients d’un magasin vis-à-vis des produits
Haut Gamme et le e-commerce, on leurs a posé les questions suivantes :
¾ Est-ce que vous achetez les produits Haut Gamme ? Vrai □ Faux □
¾ Est-ce que vous achetez vos produits via Internet ? Vrai □ Faux □
Les réponses collectées auprès des clients nous ont donné le tableau suivant :
Analyse Bivariée

126 214 clients achètent des produits


Haut Gamme via Internet.

359 859 clients n’achètent pas de


produits Haut Gamme.

207 334 clients n’achètent leurs produits


via Internet.
Pr. AIT BABRAM Mohamed

33,1 % des clients achètent des produits


Haut Gamme.

28,7 % des clients n’achètent pas des


produits Haut Gamme et n’utilisent pas
l’Internet pour faire leurs achats.

61,6 % des clients achètent leurs produits


via Internet.
FSTG Marrakech Tableau de contingence
Exemple 2 : le caractères X (Qualitatifs) et le caractère Y (Quantitatif)
Le responsable des ressources humaines de l’entreprise GISCOM à effectué
un sondage auprès de 200 employés, choisis au hasard à partir du fichier de
l’entreprise, pour connaître leur niveau de satisfaction vis-à-vis de leurs travail.
Ce caractère X a été reparti selon trois modalités : élevé, moyen, faible. On a
également noté la catégorie salariale Y à laquelle appartenait l’employé soit : 2
Analyse Bivariée

000 dhs et moins; plus de 2 000 dhs mais moins de 3 000 dhs; 3 000 dhs
et plus. A partir des résultats de cette enquête, on a construit le tableau de
contingence suivant :
Catégorie salariale (Y)
Total des lignes
Y < 2000 2000≤Y<3000 3 000≤Y
Élevé 13 19 25 57
Niveau de
Pr. AIT BABRAM Mohamed

satisfaction Moyen 28 29 28 85
(X)
Faible 24 18 16 58
Total des colonnes 65 66 69 200
FSTG Marrakech
Tableau de contingence
Exemple 3 : Les caractères X et Y (Quantitatifs)
La distribution des ouvriers des usines d’un groupe financier selon l’âge et la
rémunération mensuelle est donnée par le tableau de contingence suivant :

Age (Y)
Totaux
Analyse Bivariée

Y<25 25-30 30-35 35-40 40-45 45-50 50-55 Y≥55


X<8 207 121 38 17 10 2 7 3 405
8-9 302 461 513 103 86 6 10 2 1 483
9-10 18 526 682 567 613 431 105 60 3 002
Rémunération
mensuelle 10-12 0 111 342 298 416 480 226 37 1 910
(X) (100 dh)
12-15 0 1 3 182 227 263 98 18 792
15-20 0 0 0 18 22 13 12 5 70
Pr. AIT BABRAM Mohamed

X≥20 0 0 0 1 14 6 7 5 33
Totaux 527 1 220 1 578 1 186 1 388 1 201 465 130 7 695
FSTG Marrakech Distributions marginales
Définition : On appelle distribution marginale de X (resp. de Y) la distribution
effectif fréquence du caractère X (resp. Y) sur l’échantillon étudié
indépendamment de Y (resp. X).
Remarque : On note que la lecture de la distribution marginale de X (resp. de
Y) se fait au niveau de la dernière ligne (resp. la dernière colonne) du tableau
de contingence associé à la distribution du couple (X,Y) :
Analyse Bivariée
Pr. AIT BABRAM Mohamed

Distribution marginale de X Distribution marginale de Y


FSTG Marrakech Distributions conditionnelles
Définition : On appelle distribution conditionnelle de X sachant que Y=yj
(resp. de Y sachant que X=xi) la distribution statistique des valeurs de X (resp.
Y) obtenue en se limitant aux individus pour lesquels Y=yj (resp. X=xi).

Notation : la distribution conditionnelle de X sachant que Y=yj (resp. de Y


sachant que X=xi) est notée par [X/Y=yj] ou bien Xj (resp. [Y/X=xi] ou bien Yi).
Remarque : La lecture de la distribution conditionnelle [X/Y=yj] (resp. de
Analyse Bivariée

[Y/X=xi]) se fait au niveau de la j ème colonne (resp. la i ème ligne) du tableau


de contingence.
Distribution conditionnelle de X

Distribution conditionnelle de Y
sachant que Y=yj

sachant que X=xi


Pr. AIT BABRAM Mohamed
FSTG Marrakech Indépendance de deux caractères
Définition : On dit que deux caractères X et Y sont indépendant si et
seulement si l’une des assertions suivantes est vérifiée:
1) Les distributions en effectifs de [X/Y=yj ] pour j Є {1,…,m} sont proportionnelles.
2) Les distributions en fréquences de [X/Y=yj ] pour j Є {1,…,m} sont les mêmes.
3) Les distributions en effectifs de [Y/X=xi] pour i Є {1,…,k} sont proportionnelles.
4) Les distributions en fréquences de [Y/X=xi] pour i Є {1,…,k} sont les mêmes.

Remarque : En pratique, les conditions de la définition précédente ne sont


Analyse Bivariée

X
presque jamais vérifiées. Il faut alors vérifier que les lignes ou bien les
colonnes du tableau de contingence sont presque proportionnelles.

Remarque : D’après la définition précédente, l’hypothèse d’indépendance de


X et Y peut être résumé par la relation mathématique suivante :

=
(n )(n )
i• •j
pour i ∈{1,....,k} et j ∈{1,....,m}
Pr. AIT BABRAM Mohamed

nij
n

n32 =
(n )(n ) 72×60
3•
=
•2
= 36
n 120
FSTG Marrakech

Cas où X et Y (qualitatifs)

1. Exemple
Analyse Bivariée

2. Distribution marginale
3. Distribution conditionnelle
Pr. AIT BABRAM Mohamed
FSTG Marrakech Cas de deux caractères qualitatifs
Exemple 1 : On considère l’étude effectuée auprès des clients d’un magasin
pour voir leur comportement vis-à-vis des produits Haut Gamme X et le e-
commerce Y.

Distribution marginale de X
Analyse Bivariée

Distribution [X/Y=Vrai]

Distribution [Y/X=Vrai]
Pr. AIT BABRAM Mohamed

Distribution [Y/X=Faux]

Distribution [X/Y=Faux]
Distribution marginale de Y
FSTG Marrakech

Cas où X (qualitatif) et Y (quantitatif)

1. Moyenne et Variance marginale de Y


Analyse Bivariée

2. Moyenne et Variance conditionnelles de Y


3. Décomposition de la variance de Y
4. Analyse de la variance
5. Exemple
Pr. AIT BABRAM Mohamed
FSTG Marrakech Moyenne et Variance marginale de Y
Définition : La moyenne marginale de Y est définie comme étant la moyenne
arithmétique de la distribution marginale de Y. Elle donnée par :
1 m
y = ∑ n• j y j
n j =1
Définition : La variance marginale de Y est définie comme étant la variance de
la distribution marginale de Y. Elle donnée par :
Analyse Bivariée

V (Y ) = ∑n• j ( y j − y ) = ∑n• j ( y j ) − ( y )
1 m 2 1 m 2 2

n j =1 n j =1
Remarque : Les formules de la moyenne et la variance marginale du caractère
Y peuvent avoir plusieurs formes :
m
1 m
y = ∑ f• j y j y= ∑ p• j y j
Pr. AIT BABRAM Mohamed

j =1 100 j =1

V (Y ) = ∑ f • j ( y j − y ) = ∑ n• j ( y j ) − ( y )
m m
2 2 2

j =1 j =1

V (Y ) =
1 m
∑ •j jp ( y − y )2
=
1 m
∑ •j jp ( y )2
− ( y )2

100 j =1 100 j =1
FSTG Marrakech Moyenne et Variance conditionnelle de Y
Définition : Soit i =1,…..,k. On définit la moyenne conditionnelle de Y sachant
que X=xi par :

m(Y X = xi ) = yi = ∑nij y j
1 m
ni • j=1
Définition : Soit i =1,…..,k. On définit la variance conditionnelle de Y sachant
que X=xi par :
Analyse Bivariée

V (Y X = xi ) = ∑nij ( y j − xi ) = ∑nij (y j ) − (xi )


1 m 2 1 m 2 2

ni• j=1 ni• j=1


Remarque : L’aspect qualitatif du caractère X induit une partition de la
population étudiée en k sous population (P1, P2, ….., Pk), dont les
caractéristiques sont résumée dans le tableau suivant :
Pr. AIT BABRAM Mohamed
FSTG Marrakech
Décomposition de la Variance de Y
Remarque : La moyenne marginale de Y n’est autre que la moyenne pondérée
de toutes les moyennes conditionnelles :

y = ∑ ni • m (Y X = xi ) = ∑ ni • yi
1 k 1 k
n i =1 n i =1
Définition : On appelle variance Intra-Classe la moyenne pondérée des
variances conditionnelles :
Analyse Bivariée

VIntra(Y ) = ∑ni• V (Y X = xi )
1 k
n i=1
Définition : On appelle variance Inter-Classe la variance pondérée des
moyennes conditionnelles :
2 2
1 k 1 k
VInter(Y ) = ∑ni • ( yi − y) = ∑ni • ( yi ) − y 2
Pr. AIT BABRAM Mohamed

n i=1 n i=1
Remarque : La variance de la variable Y se décompose sous la forme :
k k 2

V (Y ) = ( ) ni• ( yi − y)
1 1

n i=1
ni• V Yi + ∑
n i=1

V (Y ) = VIntra (Y ) + VInter (Y )
FSTG Marrakech
Analyse de la variance
Principe de l’analyse : C’est une technique qui a été développée au début du
siècle par l’agronome Fischer. L’objectif est toujours de mesurer l’effet d’un
facteur qualitatif sur un caractère d’intérêt souvent quantitatif. Nous citons à
titre d’exemples les cas où :
1. On épand des niveaux d’engrais {faible, moyen, fort} (caractère X) sur des
parcelles de blé et on relève le rendement à l’hectare (caractère Y).
Analyse Bivariée

2. On nourrit des rats avec trois sources de protéines {bœuf, porc, soja}
(caractère X) et on relève la prise de poids au bout d’un mois (caractère
Y).
3. On soumet à un groupe de patients un principe actif (caractère X) et on
étudie l’évolution de leur maladie (caractère Y).
Un critère pour mesurer l’effet de ce facteur est de calculer la variance Intra-
Classe et de faire le rapport :
V Inter (Y )
Pr. AIT BABRAM Mohamed

e2 =
V (Y )

Remarque : Plus e2 est grande et plus cela indique qu’il y a un effet du


facteur X (quantitatif).
FSTG Marrakech
Exemple
Exemple 2 : le caractères X (Qualitatifs) et le caractère Y (Quantitatif)
On reprend l’étude effectué par un entreprise pour connaître le niveau de
satisfaction de son personnel vis-à-vis de leurs travail. Les données collectées
de cette enquête, on a construit le tableau de contingence suivant :
Analyse Bivariée

m(Y1)=2482,5 dhs

V(Y1)=2482,5 dhs
Pr. AIT BABRAM Mohamed
FSTG Marrakech

Cas où X et Y (quantitatifs)

1. Exemple
2. Caractéristiques marginales
Analyse Bivariée

3. Caractéristiques conditionnelles
4. Covariance
5. Relation entre caractéristiques marginales et
conditionnelles
6. Rapport de corrélation
Pr. AIT BABRAM Mohamed

7. Courbes de régression
8. Analyse de la variance
FSTG Marrakech
Exemple
Exemple 3 : Les caractères X et Y (Quantitatifs)
La distribution des ouvriers des usines d’un groupe financier selon l’âge et la
rémunération mensuelle est donnée par le tableau de contingence suivant :

Age (A)
Totaux
Analyse Bivariée

Y<25 25-30 30-35 35-40 40-45 45-50 50-55 Y≥55


X<8 207 121 38 17 10 2 7 3 405
8-9 302 461 513 103 86 6 10 2 1 483
9-10 18 526 682 567 613 431 105 60 3 002
Rémunération
mensuelle 10-12 0 111 342 298 416 480 226 37 1 910
(R) (100 dh)
12-15 0 1 3 182 227 263 98 18 792
15-20 0 0 0 18 22 13 12 5 70
Pr. AIT BABRAM Mohamed

X≥20 0 0 0 1 14 6 7 5 33
Totaux 527 1 220 1 578 1 186 1 388 1 201 465 130 7 695
FSTG Marrakech Caractéristiques marginales
Dans ce qui suit, nous nous limiterons à l’exemple précédent pour le calcul
des différentes caractéristiques soit marginale ou conditionnelles.
Les distributions marginales selon la rémunération mensuelle R ou l’âge des
ouvriers A sont fournies par les tableaux suivants
Analyse Bivariée
Pr. AIT BABRAM Mohamed

1 m 1 k
a = ∑ n• j a j = 37 ,4 ans r = ∑ ni •ri = 1008,6 dh
n j =1 n i =1

V ( A) = ∑n• j (aj − a ) = 84,22 (ans)


1m 1 k
V (R) = ∑ ni • (ri − r ) = 36350 (dh)
2 2 2 2

n j=1 n i =1

σ ( A) = V ( A) = 9,2 ans σ (R ) = V (R ) = 190,7 dh


FSTG Marrakech Caractéristiques conditionnelles
Les distributions conditionnelles des ouvriers selon le caractère rémunération
mensuelle R conditionné par le caractère âge A sont constituées par les
colonnes du tableau de contingence.
Analyse Bivariée
Pr. AIT BABRAM Mohamed

Remarque : On remarque que les écart-types sont plus faibles pour les
jeunes ouvriers que pour ceux qui sont plus âgés : la population jeune est,
comme il est naturel, plus homogène du point de vue rémunération.
FSTG Marrakech Caractéristiques conditionnelles
Les distributions conditionnelles des ouvriers selon le caractère âge A
conditionné par le caractère rémunération mensuelle R sont constituées par
les lignes du tableau de contingence. Leurs caractéristiques numériques sont
résumées dans le tableau suivant :
Analyse Bivariée
Pr. AIT BABRAM Mohamed
FSTG Marrakech Covariance
Définition : Par analogie avec le cas univarié, on définit la covariance de deux
variance de caractères X et Y par :

Cov ( X , Y ) = ∑∑ nij ( xi − x )( y j − y )
1 k m
n i =1 j =1
Remarque : On remarque que si les deux caractères sont égaux (Y=X), alors
Analyse Bivariée

on retrouve la définition de la variance.

Remarque : La covariance est nulle si les deux caractères sont indépendants.


Cette interviendra dans l’étude de la liaison entre deux caractères et
notamment dans la corrélation linéaire.
Pr. AIT BABRAM Mohamed

Remarque : Il est possible de développer la formule de définition pour obtenir


une expression mieux adaptée aux calculs numériques :

1 k m
Cov ( X , Y ) = ∑ ∑ nij xi y j − x y
n i =1 j =1
FSTG Marrakech Covariance
Remarque : Un changement de variables judicieux appliqué aux caractères X
et Y permet souvent une simplification supplémentaire des calculs. Pour cela,
si on considère x0, y0, α et β des constantes telles que :

X − x0 Y − y0
X′ = et Y ′ =
α β
Analyse Bivariée

Alors, la covariance des deux caractères X’ et Y’ est donnée par la relation


suivante:

Cov( X ′, Y ′) = αβ Cov( X , Y )
Pr. AIT BABRAM Mohamed
FSTG Marrakech Relation entre caractéristiques
marginales et conditionnelles
Remarque : La moyenne marginale est égale à la moyenne pondérée des
moyennes conditionnelles :

1 k 1 m
y = ∑ ni • yi x = ∑ n• j x j
n i =1 n j =1
Analyse Bivariée

Remarque : La variance marginale est égale à la somme de la moyenne


pondérée des variance conditionnelles et de la variance pondérée des
moyennes conditionnelles :
2 2

V( X) = ∑n• j V (Xj ) + ∑n• j (xj − x)


1k 1k 1m 1m
V(Y) = ∑ni• V (Yi ) + ∑ni• ( yi − y)
Pr. AIT BABRAM Mohamed

n i=1 n i=1 n j=1 n j=1

V (Y ) = VIntra (Y ) + VInter (Y ) V ( X ) = VIntra ( X ) + VInter ( X )


FSTG Marrakech Courbe de régression
Définition : On appelle courbe de régression de Y en X, la courbe de variation
des moyennes conditionnelles y i en fonction de xi de la variable X.

Remarque : Inversement, on appelle courbe de régression de X en Y, la


courbe de variation des moyennes conditionnelles x j en fonction de yj de la
variable Y.
Analyse Bivariée

Courbe de régression
de X en Y

Nuage de points

yj

yi Courbe de régression
Pr. AIT BABRAM Mohamed

de Y en X

xi xj
FSTG Marrakech Courbe de régression
Remarque : Dans le cas où les deux caractères X et Y sont indépendants, les
distributions conditionnelles de chacun des deux caractères sont identiques à
la distribution marginale correspondante. Il en résulte que, pour chacun des
deux caractères, les moyennes conditionnelles sont égales entre elles et
égales à la moyenne marginale :

yi = y pour i ∈ {1,2,......, k } La courbe de régression de Y en X


est la droite horizontale y = y .
Analyse Bivariée

x j = x pour j ∈ {1, 2,......, m} La courbe de régression de X en Y


est la droite verticale x = x .

Courbe de régression
de X en Y
Pr. AIT BABRAM Mohamed

y
Courbe de régression
de Y en X

x
FSTG Marrakech Courbe de régression
Remarque : Si l’indépendance de deux caractères entraîne l’existence de
droites de régression parallèles aux axes de coordonnées, la réciproque n’est
pas toujours vraie. Dans ce cas, on parlera d’absence réciproque de
corrélation, et non d’indépendance. Pour illustrer ce phénomène, nous
proposons la distribution suivante :
Analyse Bivariée

Courbe de régression
de X en Y

y
Pr. AIT BABRAM Mohamed

Courbe de régression
de Y en X

x
FSTG Marrakech Courbe de régression
Remarque : Dans le cas où il y a une liaison fonctionnelle réciproque entre
les modalité de Y et celles de X : à chaque valeur xi de X correspond une valeur
yj de Y, et réciproquement. La moyenne conditionnelle yi est égale à yi et la
moyenne conditionnelle xi est égale à xi. Pour illustrer ce phénomène, nous
proposons la distribution suivante :
Analyse Bivariée

Courbe de régression
de X en Y
Pr. AIT BABRAM Mohamed

Courbe de régression
de Y en X
FSTG Marrakech Courbe de régression
Remarque : A la différence de la propriété d’indépendance, la corrélation n’est
pas une propriété réciproque : Y peut être corrélé avec X sans que, pour
autant, X soit corrélé avec Y. Pour illustrer ce phénomène, nous proposons la
distribution suivante :

Courbe de régression
de Y en X
Analyse Bivariée

Courbe de régression
de X en Y
Pr. AIT BABRAM Mohamed

x
Conclusion : La courbe de régression permet de résumer de façon commode la
liaison existant entre deux caractères. Ce résumé a d’autant plus d’intérêt
lorsque cette courbe est représentative (le nuage de la distribution est concentré
autour de la courbe). Cette intensité de liaison est mesurée par le rapport de
corrélation.
FSTG Marrakech Rapport de corrélation
Remarque : D’après les formules précédentes, on note que la variance
marginale du caractère Y est égale à la somme de deux termes :

V (Y ) = VIntra(Y ) + VInter (Y )
Analyse Bivariée

1 k 2
VIntra (Y ) = ∑ ni • V (Yi ) 1 k
VInter(Y ) = ∑ni • ( yi − y )
n i =1 n i=1
La part de la variance La part de la variance
marginale qui mesure la marginale qui la dispersion
dispersion moyenne du des moyennes conditionnelles
caractère Y à l’intérieur des du caractère Y relatives à
sous populations. chaque sous population.
Pr. AIT BABRAM Mohamed

Variance Résiduelle Variance Expliquée


Définition : Le carré du rapport de corrélation est égale à la proportion de la
variance totale expliquée par la régression :
Variance exp liquée Variance résiduelle
η2 = = 1−
Variance totale Variance totale
FSTG Marrakech
Rapport de corrélation
Définition : Le carré du rapport de corrélation de Y en X est égal à :
2
1 k 1 k
∑ ni • ( yi − y ) ∑ ni • V (Yi )
V (Y ) n n
ηY2/ X = Inter = i=1 = 1− i=1
V (Y ) V (Y ) V (Y )
Analyse Bivariée

Définition : Le carré du rapport de corrélation de X en Y est égal à :


2

n• j (x j − x) n• j V (X j )
m
1 1m

VInter( X ) n j=1

n j=1
ηX2 /Y = = =1−
V( X ) V(X ) V( X )
Remarque : En cas d’indépendance de Y et X, toutes les moyennes
Pr. AIT BABRAM Mohamed

conditionnelles sont égales :

yi = y pour i ∈ {1,2,......, k } VInter (Y ) = 0 ηY / X = 0

x j = x pour j ∈ {1, 2,......, m} VInter ( X ) = 0 η X /Y = 0


FSTG Marrakech Rapport de corrélation
Remarque : En cas de liaison fonctionnelle de Y avec X, le rapport de
corrélation de Y en X est égal à 1. En effet on a

V (Yi ) = 0 pour i ∈ {1,2,......, k } VIntra (Y ) = 0 ηY / X = 1


Remarque : En l’absence de corrélation de Y avec X, le rapport de corrélation
de Y en X est égal à 0. En effet on a
Analyse Bivariée

yi = y pour i ∈ {1,2,......, k } VInter (Y ) = 0 ηY / X = 0


Remarque : Le rapport de corrélation ηY/X constitue donc une mesure de
l’intensité de liaison du caractère Y avec le caractère X. Il satisfait l’inégalité :

0 ≤ ηY / X ≤ 1
Pr. AIT BABRAM Mohamed

¾ Lorsqu’il est nul, il y a absence de corrélation de Y avec X.


¾ Lorsqu’il est égal à 1, il y a liaison fonctionnelle.
¾ Entre ces deux situations extrêmes, l’intensité de liaison de Y avec X
est d’autant plus forte que la valeur du rapport est proche de 1.
FSTG Marrakech Application et conclusion
On reprend toujours, l’exemple considéré au début de cette section, sur la
distribution des ouvriers des usines d’un groupe financier selon l’âge et la
rémunération mensuelle.

k 2 k 2

VInter(R) = ∑ni • (ri − r ) = ∑ni • (ri ) − (r ) = 9 835 (dhs)


1 1 2 2

n i=1 n i=1
Analyse Bivariée

σ Inter(R) = VInter(R) = 99,2 dhs


V Inter (R ) 9 835
η R2 / A = = = 0 , 27
V (R ) 36 347
Pr. AIT BABRAM Mohamed

V (R ) = V Intra (R ) + V Inter (R ) 36 347 = 26 512 + 9 835


Ainsi, dans cet exemple, 27% seulement de la variance des rémunérations
est expliquée par le facteur âge (c’est ce que exprime le rapport de
corrélation de R en A). Ceci implique une corrélation relativement faible entre
les deux caractères rémunération et âge des ouvriers.

Vous aimerez peut-être aussi