Data Minig
Data Minig
Data Minig
Fouille de données
(Examen session rattrapage)
Nom : RABEARIMANANA
Prénom : Tsirinantenaina Jean Odèle
Parcours : Génie Informatique
Niveau : M2
Codage : 015
Pour la mise en œuvre de l’AFC et de répondre les questions, l’installation et chargement des
packages FactoMineR, gplots sont nécessaire.
La fonction rowSums() permet de calculer la somme des valeurs pour chaque ligne
d’une matrice ou d’une data.frame et la fonction colSum() permet de calculer la somme
des valeurs pour chaque colonne. Enfin, la commande sum() calcule toutes les valeurs
contenus dans la matrice.
Interprétation :
o Ici la somme des valeurs de la première ligne est 261, la somme des valeurs de la
deuxième ligne est 555 et la somme des valeurs de la troisième ligne est 908.
o Ici que la somme des valeurs de la première colonne est 284, la somme des valeurs de
la deuxième colonne est 1123 et la somme des valeurs de la troisième colonne est 317.
o La somme de toutes les valeurs de la matrice K est 1724.
3. Calculons le tableau de conjointe et affichons avec 4 décimales.
Pour calculer la probabilité conjointe des valeurs dans une matrice, on divise chaque
élément de la matrice par la somme totale de tous les éléments de la matrice. La commande
round() est utilisé pour arrondir un nombre à un nombre spécifié de décimale.
Dans une distribution de probabilité, la somme totale des probabilités doit être égale à
1. Cela est dû à la nature des probabilités, qui représentent la mesure de la certitude ou de
l'incertitude associée à chaque événement dans un ensemble donné.
Lorsque nous avons une distribution de probabilités pour une variable discrète, la somme des
probabilités de toutes les catégories de cette variable doit être égale à 1. Cela signifie que l'un
des événements possibles doit se produire, car l'ensemble de tous les événements possibles
représente l'espace des probabilités complet. C'est pourquoi la somme totale des probabilités
doit être égale à 1 dans une distribution de probabilité valide. Cela est une propriété
fondamentale des probabilités et est essentiel pour interpréter correctement les résultats d'une
analyse probabiliste.
Affichage du résultat :
7. Les qualités de représentation du premier axe factoriel, du deuxième axe factoriel et
du premier plan factoriel.
8. Examinassions des éléments lignes et colonnes qui s’opposent sur cet axe et qui ont
une contribution importante.
9. Le nuage des profils lignes N(I)
Calculons le centre de gravité de N (I).