Cours 4 - CAH
Cours 4 - CAH
Plan
1. Exemples, problématique
2. Complémentarité analyse factorielle / classification
3. Comment réaliser une classification ?
4. Ressemblances entre individus et classes d’individus
5. Agrégation selon l’indice de Ward
6. Le choix du nombre de classes
7. Classification de données qualitatives
8. Classification sur facteurs
9. Interprétation des classes d’une partition
Exemples…
Exemples
• Crédit à la consommation
Quels sont les différents types de « comportement bancaire » parmi
les 66 consommateurs de l'agence ?
• Températures mensuelles
Existe-t-il des villes présentant des profils de températures similaires
tout au long de l'année ?
Exemple traité
• 52 emmentals décrits par 17 descripteurs sensoriels
• Trois types de descripteurs liés au goût, à la texture et au parfum
• Une variable de conformité (binaire)
gout caractéristique
parfum propionique
intensité du parfum
texture granuleuse
parfum butyrique
texture fondante
intensité du gout
texture collante
texture souple
texture ferme
gout piquant
Conformité
gout sucré
gout acide
gout fruité
Emmental
gout amer
gout salé
1 5,1 4 3,7 3,8 4,8 3,7 3,3 3 3,9 5,6 4,8 4,3 3,9 4,1 3,4 3,2 3,6 non
2 4,7 3,9 3,4 5,2 3 4 3,3 4 3,6 5,8 4,3 4,9 4 4,3 4,8 3,2 3,7 oui
3 4,7 4,2 2,9 3,7 3,3 2,8 3,4 4,7 3,9 5,7 4,3 4,7 3,9 4,2 4,9 3 4 oui
4 5,3 4,6 3,9 3 3,6 2,4 3,4 5,4 4,2 5,6 4,2 4,6 4 4,2 4,9 4,1 4 oui
5 4,3 4 2,6 3,9 4,1 3,3 2,9 4,2 3,7 5,1 4 4,3 3,9 4 4,3 3,8 4 oui
6 4,7 4 3,5 4,5 4,6 3,3 3,5 4,2 4,4 4,9 3,6 4,2 3,2 3,5 4 3,2 3,9 oui
7 3,6 3,7 2,6 4,1 4,4 3,1 3,4 4,5 4,1 4,5 3,4 3,5 3,2 3 4,2 2,6 4,3 oui
8 5,4 3,9 4 4,1 3,9 2,5 3,9 4,9 4 5 4,2 4,2 3,1 4,1 3,8 2,9 3,6 oui
9 4 3,8 2,6 4,5 4 4,1 3,3 3,3 4,1 4,5 3,1 3,9 3,3 3,1 3,8 3,2 3,5 oui
10 5 4,2 3,3 4,7 4,3 3,8 3,7 3,5 3,8 4,8 3,6 4 3 3,3 3,3 3,1 3,7 oui
...
52 3,7 4,1 3 3,7 4,2 4,4 2,7 2,6 3,2 3,8 2,9 3,1 2,9 3 3,4 3,5 3,2 non
variables
1 ⋯ 𝑗 ⋯ 𝑝 𝑥𝑖𝑗 : valeur prise par l’individu (𝑖)
1 pour la variable (𝑗)
individus
⋮
𝑖 𝑥𝑖𝑗
⋮
𝑛
Bas.Rhin Haute.Savoie
Haut.Rhin
Alpes.Maritimes
0.2
Vendée Yvelines
Mayenne Hauts.de.Seine
Var
Maine.et.Loire
Ain
Orne Rhône
Paris
0.1
Aube Marne
Savoie Manche
Corse.du.Sud Eure.et.Loir
Loiret Morbihan
Loir.et.Cher Cantal
Lozère
Côte.d.Or
Indre.et.Loire Pyrénées.Atlantiques
Doubs Ille.et.Vilaine
Haute.Marne
MeuseYonne Charente.Maritime
Calvados
Eure
Dim 2 (30.57%)
Vaucluse Sarthe
Oise Loire
Saône.et.Loire EssonneDeux.SèvresFinistère
Haute.Saône Lot.et.GaronneIsère
Bouches.du.Rhône
Tarn.et.Garonne Gironde Val.de.Marne
Côtes
Landesd.Armor
Territoire.de.Belfort Vienne
Val.d Oise
Alpes de Ardèche
Haute.Provence
Cher Gers
Meurthe.et.Moselle
Ardennes Hérault Indre
Gard
Pyrénées.Orientales
Aisne SommeNordSeine.Maritime Tarn
Allier
CharenteHaute.Garonne
-0.1
Dordogne
Puy.de.DômeLot
Nièvre Creuse
Pas.de.Calais Hautes.Pyrénées
Aude
Corrèze
-0.2
Haute.Vienne
Ariège
Seine.Saint.Denis
-0.3
Dim 1 (52.7%)
• Classification ascendante
hiérarchique (CAH)
• Partitionnement direct
(ex. k – means)
Nombre n d’individus
25
Nombres de Bell
Nombre k de classes
Nombre total de
partitions possibles
de n objets en k classes
[d’après Saporta, 1990]
𝑛 ∞
𝑛 1 𝑘𝑛
𝐵𝑛+1 = 𝐵 𝐵𝑛 =
𝑘 𝑘 𝑒 𝑘!
𝑘=0 𝑘=0
Conclusion
Il faut se contenter en général de recherche une partition « sous-optimale »
Deux principales familles de méthodes de classification
les méthodes produisant des arbres hiérarchiques (ex. CAH)
les méthodes de partitionnement direct (ex. nuées dynamiques, k – means)
L’algorithme de la CAH
La CAH consiste à agréger de proche en proche des individus entre eux, puis des classes
d'individus entre elles, jusqu'à obtenir une classe englobant l'ensemble de la population
D
Classification Ascendante Hiérarchique – CAH 13
Analyse des données – Master 2 Statistique / Actuariat
Le dendrogramme
Il représente le résultat du processus d’agrégation sous la forme
d’un arbre hiérarchique (binaire) ou hiérarchie
dendrogramme ou hiérarchie
Hauteur
d'agrégation
B F E Traduit le niveau
A Hauteur d'agrégation
palier de dissemblance
C entre les éléments
agrégés
« plus le palier est
haut, moins les
D éléments réunis
se ressemblent »
F E A B C D
B F E
A
D
F E A B C D
F E A B C D E F C A B D
C A B E F D D A B C F E
variables
1 ⋯ 𝑗 ⋯ 𝑝
1
individus
⋮
𝑖 𝑥𝑖𝑗
⋮
𝑛
m 𝑥𝑗
S 𝑠𝑗
g2
g1
• Distance moyenne
moy
• Indice de Ward
Deux classes sont d'autant plus proches
que leur agrégation conduit
à une faible augmentation d’inertie
(intra classe)
Application
Cinq individus 1, 2, 3, 4 et 5 sont décrits par leurs
coordonnées 𝑥, 𝑦 dans le plan
Notations
• 𝑥𝑖 : description de l’individu 𝑖
• 𝑔 : centre de gravité des 𝑛 individus
• 𝑔𝑘 : centre de gravité des 𝑛𝑘 individus de la classe 𝐶𝑘
Le théorème de Huygens
𝐼𝑊 + 𝐼𝐵 = 𝐼𝑇
Où 𝐼𝑇 =
inertie totale
• Partition en 𝐾 classes : 𝐼𝑇 𝐾 = 𝐼𝑊 𝐾 + 𝐼𝐵 𝐾
• Partition en 𝐾 − 1 classes : 𝐼𝑇 𝐾 − 1 = 𝐼𝑊 𝐾 − 1 + 𝐼𝐵 𝐾 − 1
n–1
...
Dendrogramme
produit par FactoMineR
pour l’exemple « Emmental »
Questions
• Combien de classes choisir ?
• Existe-t-il un nombre de
classes « naturel » ?
Matrice
0,0 5,7 5,6 6,3 4,5 4,1 6,5 4,8 5,5 4,1 5,5 6,2 9,1 6,5 5,6 6,7 5,4 4,5 5,3 6,1 4,1 4,4 7,5 7,0 4,5 9,4 8,5 6,8 8,7 6,5 5,4 5,0 4,4 4,0 5,6 9,7 5,9 7,3 5,6 6,5 5,2 6,2 5,2 4,8 6,5 4,8 5,8 6,1 4,5 6,0 6,5 7,2
2 5,7 0,0 3,1 5,3 4,4 5,5 7,0 5,3 5,9 5,9 7,6 7,2 9,4 8,1 6,9 8,5 6,1 6,3 6,5 5,6 5,5 5,4 8,4 8,1 5,3 10,4 9,8 8,0 10,1 8,1 6,9 6,0 4,7 6,3 4,8 10,5 6,9 6,9 6,5 7,8 5,0 7,3 6,8 5,9 8,1 7,2 4,6 6,9 4,0 7,0 7,5 8,6
3 5,6 3,1 0,0 3,6 3,6 4,9 5,8 4,5 5,9 5,8 6,2 7,4 9,5 7,6 6,4 7,6 5,6 6,5 5,6 6,6 5,8 5,6 8,6 8,3 5,0 11,1 9,2 7,4 8,8 7,3 6,0 6,5 5,6 5,8 4,2 10,9 5,9 8,0 6,2 7,3 6,3 6,5 5,5 6,4 7,5 6,9 6,3 5,9 4,3 6,6 7,1 8,6
4 6,3 5,3 3,6 0,0 4,8 5,5 7,5 4,9 7,5 6,8 5,5 8,0 11,0 8,3 6,9 8,3 6,3 6,7 6,1 8,6 7,0 7,1 10,2 9,8 6,2 11,9 10,4 8,6 9,9 8,0 6,0 6,7 7,1 5,5 5,1 12,5 5,9 9,6 6,6 7,9 7,1 7,0 5,7 6,9 8,5 7,5 7,5 6,3 5,5 6,5 8,0 9,6
de distances 5
6
7
4,5
4,1
6,5
4,4
5,5
7,0
3,6
4,9
5,8
4,8
5,5
7,5
0,0
3,8
4,6
3,8
0,0
3,7
4,6
3,7
0,0
5,2
3,4
5,6
4,1
3,5
3,4
4,7
2,6
4,6
5,0
3,6
5,6
5,7
4,2
5,0
7,7
8,0
6,7
6,7
4,7
5,2
5,0
2,9
3,7
5,9
4,2
3,6
3,5
2,9
3,9
4,6
4,0
5,9
3,9
3,8
4,7
5,2
5,7
6,3
3,5
3,3
4,3
3,4
3,4
4,3
6,4
6,0
4,5
6,4
5,5
5,0
3,5
4,1
5,3
8,7
8,3
8,2
7,9
6,6
5,6
6,8
5,7
5,9
7,3
6,6
4,4
5,5
4,4
3,8
6,2
4,7
6,3
6,3
4,2
6,5
4,8
4,4
6,0
3,8
3,0
5,3
4,0
4,3
5,4
9,2
8,3
7,2
4,6
2,9
3,8
6,7
6,3
6,7
5,1
3,9
5,3
5,7
4,4
4,5
4,7
5,5
7,0
5,7
4,6
5,0
4,3
2,7
3,8
5,5
4,5
6,5
5,9
5,7
5,2
5,5
5,3
6,7
5,6
6,4
8,1
5,5
4,8
5,2
4,1
4,8
6,6
5,2
6,2
7,4
5,2
6,3
6,0
6,2
6,2
5,6
entre les
8 4,8 5,3 4,5 4,9 5,2 3,4 5,6 0,0 5,7 3,9 5,4 5,9 9,1 5,2 5,3 5,7 5,7 4,9 4,6 6,6 5,5 5,1 7,9 6,7 4,6 9,6 7,1 5,0 7,5 5,5 3,3 3,4 4,6 4,5 4,1 9,6 4,8 7,2 4,1 5,3 5,8 4,8 4,2 4,7 6,6 5,3 6,3 4,3 4,4 5,8 6,9 7,9
9 5,5 5,9 5,9 7,5 4,1 3,5 3,4 5,7 0,0 3,2 6,0 3,4 5,6 5,0 3,3 4,1 3,5 4,3 4,1 4,1 2,1 2,3 3,4 3,7 4,2 6,2 5,6 5,8 6,0 4,0 6,5 5,7 4,5 4,1 4,9 5,8 4,0 4,7 4,1 3,9 4,9 4,5 4,0 4,6 4,2 5,1 5,8 5,3 5,1 6,2 5,5 3,9
10 4,1 5,9 5,8 6,8 4,7 2,6 4,6 3,9 3,2 0,0 5,4 3,2 7,2 4,2 3,2 4,4 4,2 4,0 3,6 5,0 3,1 3,1 5,3 4,3 4,4 7,2 5,6 4,9 6,9 4,5 5,0 4,0 3,8 3,4 4,8 6,9 4,2 5,3 3,4 4,3 4,7 3,7 3,6 3,8 5,3 4,2 5,6 5,1 4,4 5,9 6,5 5,3
11 5,5 7,6 6,2 5,5 5,0 3,6 5,6 5,4 6,0 5,4 0,0 6,0 9,8 6,3 4,6 5,8 4,1 5,6 4,9 8,2 5,7 5,9 8,3 7,7 5,6 10,0 8,3 7,4 7,3 5,5 5,7 6,3 6,9 3,8 5,7 10,6 3,7 8,6 5,5 5,8 7,5 6,3 3,7 6,7 7,3 6,7 8,7 6,5 6,5 6,9 7,1 7,9
52 emmentals 12
13
14
6,2
9,1
6,5
7,2
9,4
8,1
7,4
9,5
7,6
8,0
11,0
8,3
5,7
7,7
6,7
4,2
8,0
4,7
5,0
6,7
5,2
5,9
9,1
5,2
3,4
5,6
5,0
3,2
7,2
4,2
6,0
9,8
6,3
0,0
5,9
4,8
5,9
0,0
6,8
4,8
6,8
0,0
2,7
7,0
5,0
4,7
6,7
3,9
4,6
8,2
6,7
4,5
7,2
5,9
4,9
7,2
5,1
5,9
6,8
7,5
3,6
6,0
5,3
4,2
6,1
5,1
4,8
4,4
6,3
3,8
4,8
5,4
5,9
7,4
5,7
6,0
5,4
7,5
6,1
6,2
4,4
6,2
6,9
4,0
6,9
6,7
5,8
4,4
6,0
4,5
6,2
8,3
4,6
5,2
8,4
4,6
5,1
6,6
5,5
4,2
7,5
5,1
6,1
8,1
5,6
5,9
4,6
7,1
3,9
7,8
5,2
4,7
5,4
6,6
3,8
6,2
3,3
4,1
5,8
3,9
5,4
6,5
6,6
4,6
6,9
4,3
4,6
7,4
3,7
4,8
6,9
4,3
5,6
5,1
5,0
5,6
6,8
5,4
6,6
7,8
8,1
6,4
7,5
4,4
5,9
7,9
6,7
6,9
7,8
6,6
6,8
5,7
6,0
4,3
4,2
6,6
15 5,6 6,9 6,4 6,9 5,0 2,9 3,7 5,3 3,3 3,2 4,6 2,7 7,0 5,0 0,0 4,3 3,3 4,9 4,6 6,4 3,5 4,3 5,3 5,0 5,6 7,6 6,6 6,7 6,5 4,3 5,7 5,4 5,5 3,8 5,8 7,2 2,5 6,1 4,3 4,5 6,2 4,5 3,5 5,3 5,7 6,0 7,3 5,9 6,0 7,2 6,9 4,9
16 6,7 8,5 7,6 8,3 5,9 4,2 3,6 5,7 4,1 4,4 5,8 4,7 6,7 3,9 4,3 0,0 5,0 5,7 5,0 7,2 4,7 4,5 4,6 4,5 5,9 7,0 4,6 5,1 4,1 2,8 5,9 6,3 6,2 5,0 6,5 6,4 4,0 6,9 4,6 3,7 7,2 4,7 3,5 5,6 4,4 5,9 8,5 5,1 7,3 7,3 6,2 5,3
17 5,4 6,1 5,6 6,3 3,5 2,9 3,9 5,7 3,5 4,2 4,1 4,6 8,2 6,7 3,3 5,0 0,0 4,7 4,5 5,7 3,6 3,9 5,7 5,7 4,8 8,2 7,6 7,4 6,8 4,8 7,0 6,6 5,8 4,1 5,4 8,6 3,2 6,6 5,5 5,2 6,3 5,9 4,3 6,4 6,5 6,6 7,1 6,5 5,9 7,1 6,9 5,9
18 4,5 6,3 6,5 6,7 4,6 4,0 5,9 4,9 4,3 4,0 5,6 4,5 7,2 5,9 4,9 5,7 4,7 0,0 4,1 4,7 3,4 3,4 5,8 5,0 3,7 6,3 6,9 5,9 7,2 4,9 5,6 4,5 4,1 2,8 4,6 8,1 4,9 5,1 3,7 3,9 3,9 5,5 4,8 4,5 5,3 4,2 5,0 5,3 4,5 4,5 5,0 5,5
19 5,3 6,5 5,6 6,1 3,9 3,8 4,7 4,6 4,1 3,6 4,9 4,9 7,2 5,1 4,6 5,0 4,5 4,1 0,0 5,0 4,1 3,8 6,0 5,2 3,3 7,5 5,3 4,5 6,0 3,9 5,4 5,5 4,7 3,3 3,5 8,1 4,6 6,3 3,3 3,8 4,8 3,5 3,3 5,2 4,8 3,6 6,1 3,8 4,1 3,7 4,9 5,5
20 6,1 5,6 6,6 8,6 5,2 5,7 6,3 6,6 4,1 5,0 8,2 5,9 6,8 7,5 6,4 7,2 5,7 4,7 5,0 0,0 4,1 3,6 5,2 4,7 4,0 6,7 7,0 6,3 8,1 6,2 7,8 6,5 4,0 5,8 5,3 7,2 7,1 4,2 5,7 5,7 3,8 6,4 6,8 5,8 6,2 5,3 3,6 6,6 4,4 5,9 6,1 5,7
21 4,1 5,5 5,8 7,0 3,5 3,3 4,3 5,5 2,1 3,1 5,7 3,6 6,0 5,3 3,5 4,7 3,6 3,4 4,1 4,1 0,0 1,7 4,2 4,2 3,7 6,4 6,6 6,0 6,8 4,4 5,9 5,0 3,5 3,3 4,9 6,6 4,3 4,7 4,1 4,3 3,8 4,8 4,1 3,9 4,5 4,6 5,1 5,4 4,5 5,6 5,0 4,0
22 4,4 5,4 5,6 7,1 3,4 3,4 4,3 5,1 2,3 3,1 5,9 4,2 6,1 5,1 4,3 4,5 3,9 3,4 3,8 3,6 1,7 0,0 4,2 3,9 3,0 6,2 6,0 5,3 6,4 4,3 5,9 5,1 3,5 3,5 4,4 6,8 4,6 4,5 3,9 4,1 3,6 4,9 4,3 4,0 4,7 4,4 4,8 5,0 4,4 5,2 4,8 4,6
23 7,5 8,4 8,6 10,2 6,4 6,0 4,5 7,9 3,4 5,3 8,3 4,8 4,4 6,3 5,3 4,6 5,7 5,8 6,0 5,2 4,2 4,2 0,0 2,8 6,4 4,8 5,3 6,5 5,6 4,6 8,1 7,5 6,0 6,2 7,3 3,9 6,1 4,9 5,9 4,7 6,4 6,0 6,1 6,6 4,6 6,4 7,5 7,0 7,4 7,8 6,1 3,1
24 7,0 8,1 8,3 9,8 6,4 5,5 5,0 6,7 3,7 4,3 7,7 3,8 4,8 5,4 5,0 4,5 5,7 5,0 5,2 4,7 4,2 3,9 2,8 0,0 5,5 4,5 4,1 4,9 5,3 3,7 7,1 6,4 5,2 5,6 6,5 4,4 5,7 3,7 4,7 3,7 5,6 5,4 5,9 5,9 5,1 5,5 6,6 6,5 6,5 6,9 6,0 3,9
25 4,5 5,3 5,0 6,2 3,5 4,1 5,3 4,6 4,2 4,4 5,6 5,9 7,4 5,7 5,6 5,9 4,8 3,7 3,3 4,0 3,7 3,0 6,4 5,5 0,0 7,8 6,5 4,8 6,6 4,7 5,4 5,2 3,6 3,9 3,0 8,7 5,3 5,7 4,1 4,4 3,9 5,5 4,7 4,6 5,5 4,2 4,8 4,2 3,5 3,8 4,2 6,5
26 9,4 10,4 11,1 11,9 8,7 8,3 8,2 9,6 6,2 7,2 10,0 6,0 5,4 7,5 7,6 7,0 8,2 6,3 7,5 6,7 6,4 6,2 4,8 4,5 7,8 0,0 6,3 7,5 7,8 6,4 9,5 8,4 7,4 7,3 8,6 5,6 8,1 4,8 6,3 5,4 6,8 7,6 8,2 7,2 6,4 7,2 8,0 8,4 8,9 7,9 7,1 5,0
27 8,5 9,8 9,2 10,4 7,9 6,6 5,6 7,1 5,6 5,6 8,3 6,1 6,2 4,4 6,6 4,6 7,6 6,9 5,3 7,0 6,6 6,0 5,3 4,1 6,5 6,3 0,0 3,5 4,3 4,2 7,1 7,2 6,8 6,9 6,7 5,9 6,8 6,5 5,0 3,9 7,6 5,1 5,8 6,9 5,2 5,9 8,8 5,6 7,8 7,2 6,4 6,2
28 6,8 8,0 7,4 8,6 6,8 5,7 5,9 5,0 5,8 4,9 7,4 6,2 6,9 4,0 6,7 5,1 7,4 5,9 4,5 6,3 6,0 5,3 6,5 4,9 4,8 7,5 3,5 0,0 5,3 4,2 4,8 5,3 4,9 5,9 5,2 7,4 6,5 6,1 3,9 4,0 6,0 4,6 5,2 5,3 5,3 4,5 7,1 4,3 5,8 5,5 5,2 6,9
29 8,7 10,1 8,8 9,9 7,3 6,6 4,4 7,5 6,0 6,9 7,3 6,9 6,7 5,8 6,5 4,1 6,8 7,2 6,0 8,1 6,8 6,4 5,6 5,3 6,6 7,8 4,3 5,3 0,0 3,2 7,4 8,3 7,7 7,1 7,2 7,5 5,9 7,7 6,2 4,3 8,7 6,5 5,7 8,1 5,4 7,4 10,0 6,0 8,6 7,9 5,9 6,7
30 6,5 8,1 7,3 8,0 5,5 4,4 3,8 5,5 4,0 4,5 5,5 4,4 6,0 4,5 4,3 2,8 4,8 4,9 3,9 6,2 4,4 4,3 4,6 3,7 4,7 6,4 4,2 4,2 3,2 0,0 5,5 6,0 5,3 4,5 5,7 6,6 3,8 5,8 3,9 2,3 6,3 4,3 3,9 5,6 4,3 5,2 7,6 4,7 6,3 5,9 4,9 4,8
31 5,4 6,9 6,0 6,0 6,2 4,7 6,3 3,3 6,5 5,0 5,7 6,2 8,3 4,6 5,7 5,9 7,0 5,6 5,4 7,8 5,9 5,9 8,1 7,1 5,4 9,5 7,1 4,8 7,4 5,5 0,0 3,4 4,8 4,6 5,3 9,5 5,3 7,4 3,9 5,3 6,1 4,7 4,4 4,4 6,3 5,1 7,0 4,3 5,1 5,8 6,0 7,6
32 5,0 6,0 6,5 6,7 6,3 4,2 6,5 3,4 5,7 4,0 6,3 5,2 8,4 4,6 5,4 6,3 6,6 4,5 5,5 6,5 5,0 5,1 7,5 6,4 5,2 8,4 7,2 5,3 8,3 6,0 3,4 0,0 3,8 4,3 4,9 8,8 5,5 6,2 3,7 5,1 5,0 4,9 4,9 3,4 6,5 5,3 5,8 4,9 4,9 6,0 6,6 7,3
33 4,4 4,7 5,6 7,1 4,8 4,4 6,0 4,6 4,5 3,8 6,9 5,1 6,6 5,5 5,5 6,2 5,8 4,1 4,7 4,0 3,5 3,5 6,0 5,2 3,6 7,4 6,8 4,9 7,7 5,3 4,8 3,8 0,0 4,5 4,7 7,7 6,0 4,3 3,9 4,9 2,8 5,3 5,3 3,2 5,3 4,2 3,7 5,2 3,4 5,1 5,0 5,9
34 4,0 6,3 5,8 5,5 3,8 3,0 5,3 4,5 4,1 3,4 3,8 4,2 7,5 5,1 3,8 5,0 4,1 2,8 3,3 5,8 3,3 3,5 6,2 5,6 3,9 7,3 6,9 5,9 7,1 4,5 4,6 4,3 4,5 0,0 4,4 8,4 3,6 6,2 3,1 4,1 4,4 4,3 3,0 4,0 5,2 3,9 5,8 4,8 4,3 4,4 5,1 5,3
35 5,6 4,8 4,2 5,1 4,0 4,3 5,4 4,1 4,9 4,8 5,7 6,1 8,1 5,6 5,8 6,5 5,4 4,6 3,5 5,3 4,9 4,4 7,3 6,5 3,0 8,6 6,7 5,2 7,2 5,7 5,3 4,9 4,7 4,4 0,0 9,6 5,2 6,3 3,8 4,8 4,8 5,2 4,4 5,2 6,2 5,3 5,7 3,9 3,9 4,2 5,1 7,5
36 9,7 10,5 10,9 12,5 9,2 8,3 7,2 9,6 5,8 6,9 10,6 5,9 4,6 7,1 7,2 6,4 8,6 8,1 8,1 7,2 6,6 6,8 3,9 4,4 8,7 5,6 5,9 7,4 7,5 6,6 9,5 8,8 7,7 8,4 9,6 0,0 8,4 6,4 7,4 6,7 8,0 7,0 8,1 7,6 6,0 7,6 8,9 8,6 9,1 9,6 8,3 4,6
37 5,9 6,9 5,9 5,9 4,6 2,9 3,8 4,8 4,0 4,2 3,7 3,9 7,8 5,2 2,5 4,0 3,2 4,9 4,6 7,1 4,3 4,6 6,1 5,7 5,3 8,1 6,8 6,5 5,9 3,8 5,3 5,5 6,0 3,6 5,2 8,4 0,0 6,7 4,2 4,1 6,7 4,7 3,2 5,6 6,0 6,4 7,7 5,5 6,1 6,8 6,5 5,9
38 7,3 6,9 8,0 9,6 6,7 6,3 6,7 7,2 4,7 5,3 8,6 4,7 5,4 6,6 6,1 6,9 6,6 5,1 6,3 4,2 4,7 4,5 4,9 3,7 5,7 4,8 6,5 6,1 7,7 5,8 7,4 6,2 4,3 6,2 6,3 6,4 6,7 0,0 4,9 4,9 4,6 6,8 7,2 5,5 6,4 6,2 5,1 7,4 6,0 7,1 6,2 5,5
39 5,6 6,5 6,2 6,6 5,1 3,9 5,3 4,1 4,1 3,4 5,5 3,8 6,2 3,3 4,3 4,6 5,5 3,7 3,3 5,7 4,1 3,9 5,9 4,7 4,1 6,3 5,0 3,9 6,2 3,9 3,9 3,7 3,9 3,1 3,8 7,4 4,2 4,9 0,0 2,7 4,3 3,4 3,3 3,2 4,5 3,7 5,8 3,8 4,5 4,3 4,7 5,4
40 6,5 7,8 7,3 7,9 5,7 4,4 4,5 5,3 3,9 4,3 5,8 4,1 5,8 3,9 4,5 3,7 5,2 3,9 3,8 5,7 4,3 4,1 4,7 3,7 4,4 5,4 3,9 4,0 4,3 2,3 5,3 5,1 4,9 4,1 4,8 6,7 4,1 4,9 2,7 0,0 5,6 4,2 3,9 4,8 3,9 4,7 7,0 4,2 6,0 5,2 4,4 4,9
41 5,2 5,0 6,3 7,1 4,7 5,5 7,0 5,8 4,9 4,7 7,5 5,4 6,5 6,6 6,2 7,2 6,3 3,9 4,8 3,8 3,8 3,6 6,4 5,6 3,9 6,8 7,6 6,0 8,7 6,3 6,1 5,0 2,8 4,4 4,8 8,0 6,7 4,6 4,3 5,6 0,0 5,7 6,1 3,8 5,9 4,1 2,5 5,8 3,2 4,1 5,0 5,7
42 6,2 7,3 6,5 7,0 5,7 4,6 5,0 4,8 4,5 3,7 6,3 4,6 6,9 4,3 4,5 4,7 5,9 5,5 3,5 6,4 4,8 4,9 6,0 5,4 5,5 7,6 5,1 4,6 6,5 4,3 4,7 4,9 5,3 4,3 5,2 7,0 4,7 6,8 3,4 4,2 5,7 0,0 3,4 4,6 4,6 4,3 6,9 3,8 5,2 5,2 6,0 5,1
43 5,2 6,8 5,5 5,7 4,3 2,7 3,8 4,2 4,0 3,6 3,7 4,6 7,4 3,7 3,5 3,5 4,3 4,8 3,3 6,8 4,1 4,3 6,1 5,9 4,7 8,2 5,8 5,2 5,7 3,9 4,4 4,9 5,3 3,0 4,4 8,1 3,2 7,2 3,3 3,9 6,1 3,4 0,0 4,6 4,4 4,7 7,5 3,7 5,4 5,5 5,5 5,8
44 4,8 5,9 6,4 6,9 5,5 4,5 6,5 4,7 4,6 3,8 6,7 4,8 6,9 4,3 5,3 5,6 6,4 4,5 5,2 5,8 3,9 4,0 6,6 5,9 4,6 7,2 6,9 5,3 8,1 5,6 4,4 3,4 3,2 4,0 5,2 7,6 5,6 5,5 3,2 4,8 3,8 4,6 4,6 0,0 4,8 4,0 5,0 4,6 4,5 5,1 5,6 6,0
45 6,5 8,1 7,5 8,5 5,9 5,7 5,2 6,6 4,2 5,3 7,3 5,6 5,1 5,0 5,7 4,4 6,5 5,3 4,8 6,2 4,5 4,7 4,6 5,1 5,5 6,4 5,2 5,3 5,4 4,3 6,3 6,5 5,3 5,2 6,2 6,0 6,0 6,4 4,5 3,9 5,9 4,6 4,4 4,8 0,0 4,2 7,3 4,5 6,4 5,6 4,3 4,2
46 4,8 7,2 6,9 7,5 5,5 5,3 6,7 5,3 5,1 4,2 6,7 5,6 6,8 5,4 6,0 5,9 6,6 4,2 3,6 5,3 4,6 4,4 6,4 5,5 4,2 7,2 5,9 4,5 7,4 5,2 5,1 5,3 4,2 3,9 5,3 7,6 6,4 6,2 3,7 4,7 4,1 4,3 4,7 4,0 4,2 0,0 5,2 4,6 3,9 3,5 4,9 5,3
47 5,8 4,6 6,3 7,5 5,6 6,4 8,1 6,3 5,8 5,6 8,7 6,6 7,8 8,1 7,3 8,5 7,1 5,0 6,1 3,6 5,1 4,8 7,5 6,6 4,8 8,0 8,8 7,1 10,0 7,6 7,0 5,8 3,7 5,8 5,7 8,9 7,7 5,1 5,8 7,0 2,5 6,9 7,5 5,0 7,3 5,2 0,0 6,9 3,2 5,4 6,7 6,9
48 6,1 6,9 5,9 6,3 5,5 4,8 5,2 4,3 5,3 5,1 6,5 6,4 7,5 4,4 5,9 5,1 6,5 5,3 3,8 6,6 5,4 5,0 7,0 6,5 4,2 8,4 5,6 4,3 6,0 4,7 4,3 4,9 5,2 4,8 3,9 8,6 5,5 7,4 3,8 4,2 5,8 3,8 3,7 4,6 4,5 4,6 6,9 0,0 5,4 4,2 4,8 6,9
49 4,5 4,0 4,3 5,5 4,1 4,8 6,6 4,4 5,1 4,4 6,5 5,9 7,9 6,7 6,0 7,3 5,9 4,5 4,1 4,4 4,5 4,4 7,4 6,5 3,5 8,9 7,8 5,8 8,6 6,3 5,1 4,9 3,4 4,3 3,9 9,1 6,1 6,0 4,5 6,0 3,2 5,2 5,4 4,5 6,4 3,9 3,2 5,4 0,0 4,2 5,7 6,7
50 6,0 7,0 6,6 6,5 5,2 6,2 7,4 5,8 6,2 5,9 6,9 6,9 7,8 6,6 7,2 7,3 7,1 4,5 3,7 5,9 5,6 5,2 7,8 6,9 3,8 7,9 7,2 5,5 7,9 5,9 5,8 6,0 5,1 4,4 4,2 9,6 6,8 7,1 4,3 5,2 4,1 5,2 5,5 5,1 5,6 3,5 5,4 4,2 4,2 0,0 4,2 6,8
51 6,5 7,5 7,1 8,0 5,2 6,3 6,0 6,9 5,5 6,5 7,1 6,8 5,7 6,0 6,9 6,2 6,9 5,0 4,9 6,1 5,0 4,8 6,1 6,0 4,2 7,1 6,4 5,2 5,9 4,9 6,0 6,6 5,0 5,1 5,1 8,3 6,5 6,2 4,7 4,4 5,0 6,0 5,5 5,6 4,3 4,9 6,7 4,8 5,7 4,2 0,0 5,9
52 7,2 8,6 8,6 9,6 6,2 6,2 5,6 7,9 3,9 5,3 7,9 4,3 4,2 6,6 4,9 5,3 5,9 5,5 5,5 5,7 4,0 4,6 3,1 3,9 6,5 5,0 6,2 6,9 6,7 4,8 7,6 7,3 5,9 5,3 7,5 4,6 5,9 5,5 5,4 4,9 5,7 5,1 5,8 6,0 4,2 5,3 6,9 6,9 6,7 6,8 5,9 0,0
∗
𝐼𝑊 𝑘
𝑘 = argmin
𝑘 𝐼𝑊 𝑘 − 1
texture caractéristique
gout caractéristique
parfum propionique
intensité du parfum
texture granuleuse
parfum butyrique
texture fondante
intensité du gout
texture collante
texture souple
texture ferme
gout piquant
Conformité
gout sucré
gout acide
gout fruité
Emmental
gout amer
gout salé
Partition 6
classes
1 5,1 4 3,7 3,8 4,8 3,7 3,3 3 3,9 5,6 4,8 4,3 3,9 4,1 3,4 3,2 3,6 non C4
2 4,7 3,9 3,4 5,2 3 4 3,3 4 3,6 5,8 4,3 4,9 4 4,3 4,8 3,2 3,7 oui C5
3 4,7 4,2 2,9 3,7 3,3 2,8 3,4 4,7 3,9 5,7 4,3 4,7 3,9 4,2 4,9 3 4 oui C5
4 5,3 4,6 3,9 3 3,6 2,4 3,4 5,4 4,2 5,6 4,2 4,6 4 4,2 4,9 4,1 4 oui C5
5 4,3 4 2,6 3,9 4,1 3,3 2,9 4,2 3,7 5,1 4 4,3 3,9 4 4,3 3,8 4 oui C5
6 4,7 4 3,5 4,5 4,6 3,3 3,5 4,2 4,4 4,9 3,6 4,2 3,2 3,5 4 3,2 3,9 oui C6
7 3,6 3,7 2,6 4,1 4,4 3,1 3,4 4,5 4,1 4,5 3,4 3,5 3,2 3 4,2 2,6 4,3 oui C6
8 5,4 3,9 4 4,1 3,9 2,5 3,9 4,9 4 5 4,2 4,2 3,1 4,1 3,8 2,9 3,6 oui C4
9 4 3,8 2,6 4,5 4 4,1 3,3 3,3 4,1 4,5 3,1 3,9 3,3 3,1 3,8 3,2 3,5 oui C6
10 5 4,2 3,3 4,7 4,3 3,8 3,7 3,5 3,8 4,8 3,6 4 3 3,3 3,3 3,1 3,7 oui C6
...
...
52 3,7 4,1 3 3,7 4,2 4,4 2,7 2,6 3,2 3,8 2,9 3,1 2,9 3 3,4 3,5 3,2 non C1
La variable de partition
peut être projetée en tant
que variable supplémentaire
dans l’ACP du tableau
des données sensorielles
Exemple « Températures »
Indices d’agrégation
• Plusieurs choix possibles
• Indice de Ward compatible avec distances quadratiques
Principe
> res$ind$coord
Dim 1 Dim 2
1 -0.4079 0.0958
2 -1.0737 0.1815
3 0.5780 0.3464
4 -1.3023 0.4902
5 1.2388 0.0722
6 -0.8545 0.7146
7 -0.9888 0.7172
8 -0.7601 0.4085
9 -0.2855 -0.2845
10 -0.9888 0.7172
11 0.4869 -0.1902
12 -0.0726 -0.0187
13 0.8116 0.0899
14 -0.0726 -0.0187
15 -1.1212 -0.0258
Client Dim 1 Dim 2 Dim 3 Dim 4 Dim 5 Dim 6 Dim 7 Dim 8 Dim 9 Dim 10 Dim 11 Dim 12 Dim 13
1 -0.41 0.10 -0.32 -0.18 -0.46 0.23 -0.72 0.40 -0.13 -0.36 -0.15 -0.29 -0.34
2 -1.07 0.18 0.02 0.39 -0.24 0.56 0.10 -0.44 0.50 0.05 -0.26 -0.46 -0.05
3 0.58 0.35 -0.44 0.17 0.24 -0.49 -0.15 -0.57 -0.11 -0.43 0.24 -0.11 -0.04
4 -1.30 0.49 0.59 0.04 -0.14 -0.22 0.06 -0.01 -0.39 -0.19 -0.23 -0.15 0.22
5 1.24 0.07 0.60 -0.14 -1.29 0.05 0.66 0.18 0.13 0.03 -0.23 0.17 0.21
6 -0.85 0.71 0.16 -0.33 0.07 -0.40 -0.38 -0.07 0.00 -0.50 -0.30 0.49 0.46
7 -0.99 0.72 0.49 0.46 -0.11 -0.47 0.35 0.01 -0.47 -0.02 -0.18 0.15 -0.21
8 -0.76 0.41 -0.08 0.81 -0.21 0.31 0.40 -0.42 0.41 0.22 -0.20 -0.16 -0.49
9 -0.29 -0.28 -1.00 0.44 -0.20 0.01 0.09 0.24 0.34 0.79 0.16 0.25 -0.07
10 -0.99 0.72 0.49 0.46 -0.11 -0.47 0.35 0.01 -0.47 -0.02 -0.18 0.15 -0.21
…
...
...
La même information !
...
• Le tableau des coordonnées factorielles est soumis à une CAH avec les choix
Distance euclidienne + Indice d’agrégation de Ward
• Possibilité de réaliser la CAH sur un sous-ensemble des coordonnées
factorielles
Client Dim 1 Dim 2 Dim 3 Dim 4 Dim 5 Dim 6 Dim 7 Dim 8 Dim 9 Dim 10 Dim 11 Dim 12 Dim 13
1 -0.41 0.10 -0.32 -0.18 -0.46 0.23 -0.72 0.40 -0.13 -0.36 -0.15 -0.29 -0.34
2 -1.07 0.18 0.02 0.39 -0.24 0.56 0.10 -0.44 0.50 0.05 -0.26 -0.46 -0.05
3 0.58 0.35 -0.44 0.17 0.24 -0.49 -0.15 -0.57 -0.11 -0.43 0.24 -0.11 -0.04
4 -1.30 0.49 0.59 0.04 -0.14 -0.22 0.06 -0.01 -0.39 -0.19 -0.23 -0.15 0.22
5 1.24 0.07 0.60 -0.14 -1.29 0.05 0.66 0.18 0.13 0.03 -0.23 0.17 0.21
6 -0.85 0.71 0.16 -0.33 0.07 -0.40 -0.38 -0.07 0.00 -0.50 -0.30 0.49 0.46
7 -0.99 0.72 0.49 0.46 -0.11 -0.47 0.35 0.01 -0.47 -0.02 -0.18 0.15 -0.21
8 -0.76 0.41 -0.08 0.81 -0.21 0.31 0.40 -0.42 0.41 0.22 -0.20 -0.16 -0.49
9 -0.29 -0.28 -1.00 0.44 -0.20 0.01 0.09 0.24 0.34 0.79 0.16 0.25 -0.07
10 -0.99 0.72 0.49 0.46 -0.11 -0.47 0.35 0.01 -0.47 -0.02 -0.18 0.15 -0.21
…
...
...
Classification Ascendante Hiérarchique – CAH 42
Analyse des données – Master 2 Statistique / Actuariat
Client Dim 1 Dim 2 Dim 3 Dim 4 Dim 5 Dim 6 Dim 7 Dim 8 Dim 9 Dim 10 Dim 11 Dim 12 Dim 13
1 -0.41 0.10 -0.32 -0.18 -0.46 0.23 -0.72 0.40 -0.13 -0.36 -0.15 -0.29 -0.34
2 -1.07 0.18 0.02 0.39 -0.24 0.56 0.10 -0.44 0.50 0.05 -0.26 -0.46 -0.05
3 0.58 0.35 -0.44 0.17 0.24 -0.49 -0.15 -0.57 -0.11 -0.43 0.24 -0.11 -0.04
4 -1.30 0.49 0.59 0.04 -0.14 -0.22 0.06 -0.01 -0.39 -0.19 -0.23 -0.15 0.22
5 1.24 0.07 0.60 -0.14 -1.29 0.05 0.66 0.18 0.13 0.03 -0.23 0.17 0.21
6 -0.85 0.71 0.16 -0.33 0.07 -0.40 -0.38 -0.07 0.00 -0.50 -0.30 0.49 0.46
7 -0.99 0.72 0.49 0.46 -0.11 -0.47 0.35 0.01 -0.47 -0.02 -0.18 0.15 -0.21
8 -0.76 0.41 -0.08 0.81 -0.21 0.31 0.40 -0.42 0.41 0.22 -0.20 -0.16 -0.49
9 -0.29 -0.28 -1.00 0.44 -0.20 0.01 0.09 0.24 0.34 0.79 0.16 0.25 -0.07
10 -0.99 0.72 0.49 0.46 -0.11 -0.47 0.35 0.01 -0.47 -0.02 -0.18 0.15 -0.21
…
...
...
...
Client Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
1 -0.41 0.10 -0.32 -0.18 -0.46
2 -1.07 0.18 0.02 0.39 -0.24
3 0.58 0.35 -0.44 0.17 0.24
4 -1.30 0.49 0.59 0.04 -0.14
5 1.24 0.07 0.60 -0.14 -1.29
6 -0.85 0.71 0.16 -0.33 0.07
7 -0.99 0.72 0.49 0.46 -0.11
8 -0.76 0.41 -0.08 0.81 -0.21
9 -0.29 -0.28 -1.00 0.44 -0.20
10 -0.99 0.72 0.49 0.46 -0.11
…
Mise en œuvre
dans FactoMineR
Question
Quelles sont les variables qui ont « contribué » le plus
à la création des classes de la partition ?
Méthodologie statistique
Étude de la liaison entre la variable de partition (qualitative) et
chaque variable (qualitative ou quantitative) :
• Si qualitative : liaison entre deux variables qualitatives
Tableau de contingence, test du Chi2
• Si quantitative : liaison entre une variable qualitative et une quantitative
Analyse de la variance à un facteur
• Exemple
Lien entre la partition et la question
« Quelle est votre position face à la culture des OGM ? »
Classe PC_Favorable PC_Pas Favorable du Tout PC_Plutôt Défavorable
1 42 0 4
2 4 1 47
3 2 32 3
Tableau de synthèse
$test.chi2
p.value df
Position.Culture 4.464795e-41 4
Position.Al.A 4.943024e-36 6
Position.Al.H 1.202362e-33 4
Danger 9.559578e-12 2
Manif 2.314111e-07 2
Grds.Parents 4.492277e-07 2
Menace 3.346178e-06 2
Famine 3.937522e-06 2
Procédé.Inutile 2.553569e-05 2
Concerné 2.870236e-05 6
Parti.Politique 4.777906e-04 8
Risque.Eco 1.788315e-03 2
Produits.Phytosanitaires 4.014243e-03 2
Info.Active 7.627213e-03 2
CSP 8.994752e-03 18
Relation 1.325999e-02 2
Futur.Progrès 1.504807e-02 2 Sortie FactoMineR
Tableau de synthèse
$quanti.var
Eta2 P-value
intensité.du.gout 0.7701139 1.276654e-13
gout.salé 0.7186823 1.203066e-11
gout.fruité 0.6506794 1.520774e-09
texture.granuleuse 0.6440460 2.310547e-09
texture.souple 0.5719232 1.363082e-07
texture.fondante 0.5703218 1.479529e-07
gout.sucré 0.5301961 1.042116e-06
gout.caractéristique 0.4972990 4.524208e-06
texture.caractéristique 0.4822602 8.543592e-06
gout.acide 0.4774031 1.044420e-05
gout.piquant 0.4752752 1.139734e-05
texture.collante 0.3703465 5.380891e-04
parfum.propionique 0.3577279 8.108694e-04
intensité.du.parfum 0.3320218 1.811232e-03
texture.ferme 0.3309750 1.869837e-03
parfum.butyrique 0.2758158 9.117640e-03 Sortie FactoMineR
Méthodologie
Toutes les variables du tableau de données, active ou supplémentaire,
quantitative ou qualitative, sont analysées à tour de rôle dans chaque classe
Goût fruité
est caractéristique des emmentals
de la classe 5
Sa moyenne dans la classe est
significativement supérieure à la
moyenne générale
Texture souple
est caractéristique des emmentals
des classes 3 et 5
Sa moyenne dans la classe est
significativement inférieure à la
moyenne générale
• Méthodologie statistique
Pour chaque variable 𝑋, on teste l’hypothèse :
𝐻0 ∶ les individus de la classe k ont été tirés au hasard dans la population
Statistique de test
Sous H0 , la moyenne de X dans la classe (𝑋𝑘 ) est peu différente de la
moyenne de X dans la population (𝑋)
Plus précisément : sous l'hypothèse de normalité de X,
𝑠 𝑛−𝑛𝑘 𝑋𝑘 −𝑋
𝑋𝑘 ≈ 𝒩 𝑋, ou 𝑉 − Test = ≈ 𝒩 0,1
𝑛𝑘 𝑛−1 𝑠𝑋
𝑘
$quanti$`2`
v.test Mean in category Overall mean sd in category Overall sd p.value
gout.amer -2.058989 3.066667 3.448077 0.3299832 0.4777714 0.039495306
parfum.butyrique -2.136781 2.700000 3.176923 0.4396969 0.5756653 0.032615779
gout.acide -2.148858 3.083333 3.571154 0.2967416 0.5855098 0.031645675
intensité.du.gout -2.408617 4.150000 4.659615 0.2565801 0.5457034 0.016013105
gout.salé -2.470901 3.416667 3.873077 0.2477678 0.4764110 0.013477301
parfum.propionique -2.644705 3.183333 3.663462 0.2192158 0.4682327 0.008176211
gout.fruité -2.849798 3.033333 3.609615 0.2134375 0.5215582 0.004374695
gout.sucré -3.084028 2.516667 3.075000 0.2671870 0.4669356 0.002042181
texture.granuleuse -3.187580 2.383333 3.430769 0.2733537 0.8475164 0.001434686
$quanti$`5`
v.test Mean in category Overall mean sd in category Overall sd p.value
gout.fruité 4.258905 4.866667 3.609615 0.04714045 0.5215582 2.054311e-05
gout.sucré 3.374374 3.966667 3.075000 0.04714045 0.4669356 7.398375e-04
intensité.du.gout 3.368876 5.700000 4.659615 0.08164966 0.5457034 7.547550e-04
gout.salé 3.190757 4.733333 3.873077 0.12472191 0.4764110 1.419003e-03
texture.fondante 2.473516 4.700000 3.776923 0.57154761 0.6594331 1.337907e-02
parfum.propionique 2.150617 4.233333 3.663462 0.28674418 0.4682327 3.150643e-02
gout.acide 2.099030 4.266667 3.571154 0.04714045 0.5855098 3.581426e-02
texture.souple -3.030172 3.300000 4.078846 0.24494897 0.4541842 2.444142e-03
cluster: 1
26 36 13 52 23
6.325038 6.313429 5.907366 4.799391 4.603200
------------------------------------------------------------------------------------------------
cluster: 2
29 27 28 16 30
5.948479 5.025242 4.034969 3.688640 3.537056
------------------------------------------------------------------------------------------------
cluster: 3
47 20 38 41 49
5.349783 5.104888 4.352613 3.948951 3.555841
------------------------------------------------------------------------------------------------
cluster: 4
31 51 1 50 32
5.297346 4.955671 4.633673 4.626562 4.448787
------------------------------------------------------------------------------------------------
cluster: 5
4 3 2
5.687283 5.098952 4.579356
------------------------------------------------------------------------------------------------
cluster: 6
11 17 12 15 37
4.876756 4.777940 4.373645 4.264669 4.104429
Individus moyens
Individus spécifiques
62
Analyse des données – Master 2 Statistique / Actuariat
Paramétrage de la classification
sur facteurs
(fonction HCPC de R)
63