SUJET 1 D'analyse de Données M1

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 5

INSTITUT UNIVERSITAIRE DES SCIENCES ET UNIVERSITY INSTITUTE OF SCIENCE AND

TECHNIQUES DE YAOUNDE TECHNOLOGY OF YAOUNDE

INSTITUT SUPERIEUR DES SCIENCES HIGHER INSTITUTE OF ECONOMICS AND


ECONOMIQUES ET DE GESTION MANAGEMENT

ANNEE ACADEMIQUE 2023-2024 ACADEMIC YEAR 2023-2024

EXAMEN SEMESTRIEL
NIVEAU / Level: IV FILIERE(S) / Filière : gestion
SPECIALITE(S) / Option: FICO/CCA/GPR EPREUVE / Test : : ANALYSE DE DONNEES
Durée /Duration : 2h ENSEIGNANT / Examiner : TANKA LANDRY

Exercice 1 : questions de cours (5 points)

1- définir : variable, logiciel SPSS. 1pt

2- Discuter des échelles primaires de mesure 2pts

3- Comment procède-t-on pour déterminer le niveau de mesure d’une variable ? 2pts

Exercice 2 : Codification des données (5 points)

Lors d’une enquête pour la réalisation de votre mémoire de fin d’étude, vous avez réalisé un
questionnaire pour la collecte des informations. Voici un extrait de deux questions qu’on peut
retrouver dans ledit questionnaire.

1- Combien de malade avez-vous reçu pendant le mois de novembre dans votre CSI.

□ Moins de 30 □ de 30 à 50 □ plus de 50

2- Parmi ces maladies, quelles sont celle de vous avez le plus diagnostiquées ?

□paludisme □typhoïde □VIH/sida □tuberculose □Autres

On vous demande de procéder à la codification de ces deux questions en précisant : le nom, le


type, l’étiquette, les valeurs et le niveau de mesure de la variable. 5pts

CAS PRATIQUE : 10 POINTS


Une étude a été menée pour mesurer la satisfaction des clients d’un Hôtel dans la ville de
Yaoundé. À partir d’un échantillon aléatoire de la clientèle, on a demandé aux personnes
choisies d’exprimer leur satisfaction (ou leur insatisfaction) face aux éléments suivants : la
restauration ; le prix ; l’hébergement ; l’accueil ; l’attrait du site ; le stationnement ;
l’ambiance ; la propreté.

1
Les résultats de L’analyse factorielle en composantes principales de la satisfaction des clients
de cet hôtel sont présentés ci-dessous.

L’étude de La validité de l’échelle de la mesure de la satisfaction des clients de l’hôtel a


donné un alpha de Cronbach de 0.8.

On vous demande d’analyser les résultats de cette ACP 10pts

2
ELEMENT DE CORRECTION

Exercice 1 : questions de cours (5 points)

1- Discuter des échelles primaires de mesure 2.5pts

On a les échelles nominales, les échelles ordinales et les échelles métriques

2- Comment procède-t-on pour déterminer le niveau de mesure d’une variable ? 2.5pts

Pour définir le type de l'échelle correspondant à cette variable, le chercheur sera amené à se
poser les questions suivantes :

a) « Les catégories sont-elles ordonnées ? »

- si les catégories ne sont pas ordonnées, la variable est nominale (exemple : les renseignements
signalétiques, ...) ;
- si elles le sont, le chercheur se posera la question suivante.

b) « Les intervalles entre les catégories peuvent-ils être considérés comme égaux ? » :

- si l’égalité des intervalles entre les catégories n’est pas vérifiée (ou ne peut être démontrée), la
variable est ordinale (Exemple : classement des films par ordre de préférence) ;

- si l’égalité des intervalles est vérifiée, le chercheur se posera la question suivante :


c) « L'origine zéro de l'échelle est-elle absolue ou est-elle fixée arbitrairement ? » :

- si l'origine zéro est fixée arbitrairement, c'est une échelle d'intervalle (exemple : les échelles
de température Celsius et Fahrenheit) ;

- si le zéro est absolu, l'échelle est de ratio (exemple : poids, distance, ...)

Exercice 2 : Codification des données (5 points)

1- Combien de malade avez-vous reçu pendant le mois de novembre dans votre CSI.

□ Moins de 30 □ de 30 à 50 □ plus de 50

Nom : V1, Type : Numérique, étiquette : Nombre de malade reçu ; Valeurs : 1=moins de 30 2= 30 à
50 et 3= plus de 50 ; niveau de mesure : Métrique

2- Parmi ces maladies, quelles sont celle de vous avez le plus diagnostiquées ?

□paludisme □typhoïde □VIH/sida □tuberculose □Autres

3
Nom : V2, Type : chaine de caractère, étiquette : maladie diagnostiquée ; Valeurs : 1=paludisme 2=
typhoïde 3= VIH/sida 4= tuberculose 5= autres ; niveau de mesure : Nominale.

CAS PRATIQUE : 10 POINTS

L’analyse des résultats d’une ACP revient à répondre à trois grandes interrogations :

- Les données sont-elles factorisables ?

Pour répondre à cette question, il faut examiner trois conditions:

 1ère condition : il convient d’observer la matrice des corrélations (« correlations

matrix »). Si plusieurs variables sont corrélées (>0,50), la factorisation est

possible. Si non, la factorisation n’a pas de sens et n’est donc pas conseillée.

 2ème condition : il faut observer la « Measure of Sampling Adequacy » (MSA)

ou indice de KMO (Kaiser-Meyer-Olkin). L’indice KMO indique dans quelle

proportion les variables retenues forment un ensemble cohérent et mesurent de

manière adéquate un concept. Le KMO teste si les corrélations partielles entre

les variables ne sont pas trop faibles. Cet indice doit tendre vers 1. Si ce n’est

pas le cas, la factorisation n’est pas conseillée. Des valeurs de KMO comprises

entre 0,3 et 0,7 représentent des solutions factorielles tout juste acceptables. Il

est préférable que le KMO dépasse le seuil de 0,7.

 3ème condition : il faut examiner le test de sphéricité de Bartlett. Ce test

examine la matrice des corrélations dans son intégralité et fournit la probabilité

de l’hypothèse nulle selon laquelle toutes les corrélations sont de zéro. Si la

signification (Sig.) tend vers 0,000, c’est très significatif ; inférieure à 0,05

significatif ; entre 0,05 et 0,10 acceptable et au dessus de 0,10, on rejette.


4
Si l’ACP satisfait à au moins deux de ces trois conditions, on peut continuer

l’analyse.

- Combien de facteurs retenir ?

Il n’existe pas de base quantitative exacte pour déterminer le nombre de

composantes principales à retenir.

• Si l’on retient p composantes principales à partir de p variables initiales, on

conserve 100 % de l’information ou de l'inertie de départ.

• Dès que l’on retient moins de composantes que de variables initiales, il y a

déperdition d’information.

• Choisir un nombre de composantes principales, c’est arbitrer entre la volonté de

résumer les données qui pousse à en retenir peu et celle de ne pas déformer

excessivement l’information.

- Comment interpréter les résultats ?

C’est la phase la plus délicate de l’analyse.

• On donne un sens à un axe grâce à une recherche lexicale (ou recherche des

mots) à partir des coordonnées des variables et des individus.

• Ce sont les éléments extrêmes qui concourent à l’élaboration des axes.

Vous aimerez peut-être aussi