Afcm Avec R
Afcm Avec R
Rakotomalala
http://eric.univ-lyon2.fr/~ricco/cours
Références :
1. M. Tenehaus, « Statistique – Méthodes pour décrire, expliquer et prévoir », Dunod, 2006 ;
pages 253 à 264, partie théorique ; pages 266 à 276, pour l’exemple que nous traiterons.
2. Tutoriels Tanagra, « AFCM – Races canines », http://tutoriels‐data‐
mining.blogspot.com/2008/03/afcm‐races‐canines.html ; description des mêmes calculs
sous le logiciel Tanagra. Les résultats sont complètement identiques.
3. Husson, Le, Josse, Mazet, « FactoMineR », http://factominer.free.fr/ ; package que nous
privilégierons pour l’ACM (méthode MCA).
4. D’autres packages réalisent l’ACM (procédure mca avec MASS, dudi.acm avec ADE4)
Les mêmes calculs ont été reproduits dans Tanagra. D’autres packages de R peuvent réaliser
également une AFCM (ou ACM – Analyse des correspondances multiples), nous avons choisi
FactorMineR pour sa simplicité et son adéquation avec les sorties usuelles des logiciels qui
font référence (et que l’on retrouve dans notre ouvrage ci‐dessus).
Traitements réalisés
• Réaliser une AFCM (ACM) sur un fichier de données.
• Afficher les valeurs propres. Construire le graphiques éboulis des valeurs propres.
• Calculer les coordonnées factorielles, les cos² et les contributions des individus
• Calculer les coordonnées factorielles, les cos² et les contributions des points modalités
• Projeter les points dans le premier plan factoriel (représentation pseudo‐barycentrique)
• Projeter les points dans le premier plan factoriel (représentation barycentrique)
• Positionner les modalités d’une variable illustrative qualitative
• Commenter les autres sorties/graphiques produits par la procédure MCA de FactoMineR
Label des Variable
observations Variables actives illustrative
R.R. – Université Lyon 2 qualitative 2
Fichier de données
Importation, statistiques descriptives et graphiques
#changement de répertoire
setwd("D:/_Travaux/university/Cours_Universite/Supports_de_cours/Info
rmatique/R/Tutoriels/afcm")
Traquer surtout les
modalités très rares, elles
peuvent fausser les calculs.
R.R. – Université Lyon 2 3
Analyse des correspondances multiples
La procédure MCA de FactoMineR
#charger le package
library(FactoMineR)
#lancer l'ACM
#voir l'aide pour plus de détails sur les options
#notamment -> ind. supplémentaires, var. quanti. supplémentaires
canines.acm <- MCA(canines,ncp=2,quali.sup=c(7),graph=F)
print(canines.acm)
#les valeurs propres
print(canines.acm$eig)
#scree plot
plot(canines.acm$eig[,1],type="b",main="Scree plot")
Le seul intérêt du rapport est
de (1) montrer que les calculs
ont été correctement réalisés ;
(2) fournir la liste des champs
que nous pourrons exploiter
pour accéder aux résultats
détaillés
Scree plot
0.5
0.4
canines.acm$eig[, 1]
0.3
0.2
0.1
Tableau et graphique pour
une meilleur appréciation
0.0
2 4 6 8 10
4
Index
R.R. – Université Lyon 2
Analyse des correspondances multiples
Informations sur les individus
Basset
1.0
Mastiff
Pekinois
Chihuahua
St-Bernard
Bull-Dog
0.5
Bull-Mastif Teckel
Dogue All Terre-Neuve
Comp.2
Fox-Terrier
Cocker
0.0
Fox-Hound
Caniche
Levrier
Gd Bleu Gasc
Doberman
Setter
Pointer Beauceron
-0.5
Berger All
Epag.Colley
Français
Cf. Tenenhaus, page 268.
Boxer
-1.0
Dalmatien
Labrador
Epag. Breton
Comp.1
Cf. Tenenhaus, page 271.
Le carré de la corrélation Projection des modalités
correspond au COS².
La dernière colonne est la
1.0
Veloc-
oids++ Taille
valeur‐test (page 261) Intell- Poids-
0.5
Affec-
Agress+
Comp.2
0.0
Taille++
Agress-
Intell+ Affec+
Veloc++
-0.5
Intell++
Poids+ Veloc+
-1.0
Taille+
Comp.1
Basset
Poids++
Veloc- Noter le positionnement
1.0
Taille-
Mastiff
Intell- Chihuahua
Pekinois Poids- des modalités de la
variable supplémentaire en
St-Bernard
Bull-Mastif
Dogue All Terre-Neuve
Bull-Dog
Teckel noir.
0.5
utilite
Affec-
Agress+
Dim 2 (23.08%)
Fox-Terrier
compagnie
Cocker
Nous avons la
Fox-Hound
Taille++ Caniche représentation pseudo‐
0.0
Levrier
Gd Bleu Gasc
Agress-
Intell+ Affec+
barycentrique dans ce cas,
Doberman
Veloc++ Setter
PointerBeauceron
Bergerchasse
Intell++
All
Fig.8.1, page 270.
Epag.Colley
Français
-0.5
Poids+
Veloc+
Boxer
Dalmatien
Labrador
-1.0
Epag. Breton
Taille+
-1.5
Dim 1 (28.9%)
Variables representation
1.0
0.8
Poids
Velocite
Dim 2 (23.08%)
0.6
Taille
0.4
Il s’agit des rapports de
Intelligence
corrélation des variables avec les
0.2
facteurs, y compris la variable Fonction
Affection
Agressivite
supplémentaire FONCTION.
0.0
Basset
1.5
Mastiff
Chihuahua
Pekinois
1.0
Veloc-
Poids++St-Bernard
Taille- Bull-Dog
Teckel
Bull-Mastif
Dogue All Poids-
Terre-Neuve Intell-
0.5
c(f2etoile, g2)
Affec-
Agress+ Fox-Terrier
Cocker
0.0
Fox-Hound
Taille++ Caniche
Levrier
Gd Bleu Gasc Agress-
Intell+ Affec+
Veloc++
-0.5
Intell++
Doberman
Setter
Pointer Beauceron
Berger All
Poids+
Epag. Colley
Français
Veloc+
-1.0
Taille+
-1.5
Boxer
Labrador
Dalmatien
Epag. Breton