Acp Partie 2 FCF S3
Acp Partie 2 FCF S3
Acp Partie 2 FCF S3
Procédure de l’ACP
On cherche X’ la transposée de la matrice X.
On détermine les valeurs propres de la matrice symétrique X’X.
Soient , ,..., ces valeurs propres.
1 2 k
On classe 1 2 2 4 ....
.
Alors
1 ... 0
2
XX ' = AA−1 où: =
0 ... k
Xp Y
• Notons par 𝑥1 , 𝑥2 , … , 𝑥𝑛 le nuage de points et
𝑦1 , 𝑦2 , … , 𝑦𝑛 leurs projections sur Y. En utilisant
la formule suivante :
X2
d 2 (xi , g ) = d 2 ( yi , g ) + d 2 (xi , yi )
g Y1
EST FCF
Y2
Les variables bien représentées sont celles qui
sont proches du cercle, celles qui sont proches de
l’origine sont mal représentées.
Y1
On obtient alors ce que l’on appelle
communément le “cercle des corrélations”,
un dénomination qui vient du fait qu’un
coefficient de corrélation variant entre -1 et +1.
corrélation = cosinus
EST FCF
Le tableau ci-dessous présente les données infarctus.sav tel que la variable prono indique la
classe de chaque observation et la variable prono1 est son codage en format numérique.
EST FCF
Énoncé:
Partant d’un échantillon de n individus d’un ensemble de p variables aléatoires réelles
X1 , X2 ,..., X p , le test concerne la validité de
( H 0 ) : (hypothèse nulle) : les variables sont globalement indépendantes.
( H 1 ) : les variables sont globalement dépendantes.
En se basant sur une estimation de la matrice de corrélation , le test évalue
2p + 5
= − n − 1 −
2
ln det
6 p ( p + 1)
qui, sous ( H 0 ) , suit «approximativement» une loi de 2
disposant de degrés
2
de liberté, i.e:
1 𝑝 𝑝+1 −𝑥
𝑓𝜒 2 𝑥 = 𝑝 𝑝+1
𝑥 4 −1 𝑒 ൗ2 , 𝑥 ∈ ℝ+
2 4
• On définit la P-value par:
KMO = i j i
+ r
i j i
2
ij
i j i
2
ij
L’indice KMO varie entre 0 et 1. S’il est proche de 0, les corrélations partielles sont identiques aux
corrélations brutes. Dans ce cas, une compression efficace n’est pas possible. Les variables sont
deux à deux orthogonales. S’il est proche de 1, nous aurons un excellent résumé de l’information
sur les premiers axes factoriels.
On nous donne parfois ici et là des grilles de lecture :
o « inacceptable » en dessous de 0.5;
Caractéristiques univariées :
Nous pouvons aussi conclure qu’il existe une liaison (ici ρ > 0,5) entre :
fréquence cardiaque et Index systolique, Pression artérielle pulmonaire et
Résistance pulmonaire.
Nous pouvons donner les combinaisons linéaires des trois axes principaux en tenant
compte les trois équations suivantes :
1- Qualité de représentation :
• Le tableau permet de savoir comment les variables sont expliquées par les axes
retenus (ici, 3). On peut considérer ces extractions comme étant la somme des
contributions des axes à la variable. Examinant le tableau ci-dessous, nous constatons
qu’elles sont toutes quasiment bien expliquées puisque les coefficients d’extraction
dépassent 0.7.
Les coordonnées factorielles des 7 variables du tableau de données par rapport aux
trois composantes sont données par le tableau de la matrice des composantes.
En général, on prend les deux premiers axes des composants. On obtient ainsi les
projections des variables utilisées de l'ACP sur le graphique-plan composante1 ×
composante2 noté Y1× Y2.
EST FCF
34
EST FCF
Nous constatons que les variables qui forment même groupe ont le même effet sur
l’infarctus et que l’influence du 1er groupe et 2eme groupe sont opposés à l’effet
de 3eme groupe.
EST FCF
Avant la rotation
EST FCF
Descriptives
Extraction
Rotation
Scores
EST FCF
• L'analyse consiste à déterminer les critères selon lesquels on peut faire un regroupement sur
les voitures. Le fichier de données est fourni sous le nom 'Voitures.sav'.
• L'analyse sera basée sur la méthode d‘une ACP du module professionnel du logiciel SPSS et
se déroulera selon les étapes suivantes :
Etape 1 : faire une analyse descriptive uni et bidimentionnelle sur les sept variables du
problème. Que pouvez vous conclure ? Ces variables sont-elles toutes pertinentes
pour une analyse factorielle ?
Etape 2 : On utilisera la méthode en composantes principales pour extraire les facteurs.
quelle est la proportion de variance expliquée par les facteurs extraits ?
le modèle factoriel obtenu ajuste-t-il bien les données?
les facteurs sont-ils interprétables ? (se baser sur la représentation des données
dans les plans factoriels);
une rotation des facteurs est-elle pertinente ?
Si oui, donner une interprétation aux nouveaux facteurs.