Classification Ensias
Classification Ensias
Classification Ensias
Méthodes de classication
2017-2018
Introduction
Introduction
Introduction
Introduction
Introduction
La classication hiérarchique (Hierarchical Cluster Analysis) fait
partie des techniques de classication traditionnelles.
Menée à la n d'une phase exploratoire, elle permet d'identier des
groupes d'individus (répondants, clients, patients, produits) en
fonction de similitudes.
Nous pouvons distinguer deux types de techniques de classication :
∗ les classications hiérarchiques qui s'utilisent généralement sur
des jeux de données relativement petits,
∗ les classications non hiérarchiques (nuées dynamiques).
On note que les deux types de techniques de classication ne
s'utilisent pas dans le même contexte :
,→ Compte tenu de son algorithme relativement lourd, la
classication hiérarchique s'utilise sur des jeux de données
relativement petits (maximum 200 observations) contrairement
à la classication non-hiérarchique.
Mohammed El Haj Tirari Statistiques pour des données de gran
Introduction Principe
la classication hiérarchique Mise en oeuvre avec SPSS
La classication hiérarchique
Le choix de la métrique
Le choix de la métrique
Distance euclidienne
0
d2M (k, l) = (xk − xl )M(xk − xl )
a+b+c+d=n
Choix de la méthode
Stratégies d'agrégation
Stratégies d'agrégation
Stratégies d'agrégation
Stratégies d'agrégation
3. La méthode d'agrégation suivant la distance moyenne entre les
classes (Between-groups Average Linkage ou Baverage)
Le principe de cette méthode est de prendre en compte une moyenne
de distances entre les classes, pour chaque individu. Elle se base sur
la stratégie d'agrégation du lien moyen (Between group method)
1 X
D(C1 , C2 ) = d(x, y)
card(C1 )card(C2 )
x∈C1 ety∈C2
Stratégies d'agrégation
Stratégies d'agrégation
Stratégies d'agrégation
Stratégies d'agrégation
6. La technique d'agrégation selon la méthode de Ward
Stratégies d'agrégation
Etude graphique
Choix de la méthode
Choix de la métrique
Graphiques
Statistiques