Cours Spss
Cours Spss
Cours Spss
Indications Générales :
Les étudiant-e-s seront réparti-e-s en 4 groupes (jaune, bleu, rouge et vert). Les
cours ont lieu en alternance une semaine sur deux les jeudis de 10h-12h en salle
U300 (en alternance jaune-bleu et rouge-vert).
Les TD ont lieu en alternance les mardi de 18h-20h pour les groupes jaunes et
rouge et les mercredis de 12h-14h pour les groupes bleu et vert (à l’exception du
7 juin pour les bleus, les TD auront lieu le mardi de 14h-16h au lieu des TP) en
salle M4183.
Pour les TP, ils ont lieu les mercredis 14h-16h et jeudis 16h-18h en salle M5183
indépendamment de votre groupe d’appartenance.
Objectifs du cours :
Descriptif du cours :
Le cours aborde tous les aspects de l'analyse de données, aussi bien théoriques
que l'application avec un logiciel statistique. Les données utilisées proviennent de
recherches dans le domaine de la psychologie. Les étudiant-e-s apprennent
comment entrer les données dans l'ordinateur et comment effectuer des calculs
élémentaires, qui répondent aux questions de recherche. Le cours donne aussi
une introduction aux méthodes statistiques pour décrire la distribution des
variables nominales, ordinales et quantitatives et leurs relations.
Programme indicatif :
Il peut être acheté à la centrale des polycopiés (ou téléchargé depuis dokeos).
Informations et documents :
Examen :
Eté 2006 : Distribution, le 15 juin 2006 lors du cours, du ou des jeu/x de donnée
pour l’examen. L’examen sera un écrit de 2 heures portant sur les analyses faites
à la maison et sur la matière vue en cours et aux travaux dirigés.
Toutes vos questions doivent être posées dans un premier temps aux moniteurs.
Si vous avez encore des questions vous prendre rendez-vous durant le TD ou par
mail avec Katia Iglesias ([email protected]).
Support
de
cours
Logiciels statistiques et psychologie :
1 2
Connaissances utiles
Le choc des statistiques
• Comprendre la littérature, la recherche, lire les
• Les nombres peuvent effrayer certains. résultats, pouvoir être critique, etc.
• But du cours : faire disparaître la peur des uns et • Mémoire de fin d’études
augmenter le plaisir des uns et des autres.
3 4
La psychologie et la recherche
Amélioration des débouchés
Pour trouver une réponse à nos questions :
Recherche : électro-encéphalogramme
• 8 cartes topographiques (128 ms par carte) de la bande Delta Echantillon : 751 adolescents noirs entre 14 et 17 ans de la
(rouge = polarité positive, bleu = polarité négative) vue de dessus
région de Philadelphia
(partie supérieure de la carte = partie antérieure du scalp).
• Encadré en rouge les périodes durant lesquelles l’énergie dans
cette bande est significativement différente comparée à la
condition « familiarité » (p< 0.05).
Extrait de Grandjean, D., Scherer, K.R. (2003). Appraisal processes in emotion elicitation: a topographic
electrophysiological approach. Human Brain Mapping, New-York: USA.
9 10
2.0
Nombre de relation(s) sexuelle(s) par mois
forte
1.5
• Désaprobation maternelle :–1.74 Influence négative
moyenne
1.0
• Discussion contraception : 0.83 Pas d’influence
0.5
0.0
0 10 20 30 40 50
Satisfaction de la relation
Jaccard, J., Dittus, P. J., and Gordon V. V. (1996). Maternal Correlates of Adolescent Sexual and Contraceptive Behavior. Family
Planning Perspectives. 28, 4, 159-165.
13 14
Expérience :
• Mesurer l’effet de l’âge sur les capacités cognitives
• Passation des tâches l’après-midi par commodité pour le chercheur
Informations pratiques
Erreur méthodologique :
• ne pas tenir compte que les conditions optimales de passation pour
chacun des groupes sont différentes
• les personnes âgées sont plus performant le matin et les jeunes
l’après-midi.
Helmuth, L., (2003). The Wisdom of the Wizend. Science, 299, pp. 1300-1302
15 16
Programme du cours Programme du cours
• La démarche de la recherche : où, quand et pourquoi • Vu le nombre important d’étudiants suivant ce cours,
utiliser SPSS ? vous serez séparé en deux groupes pour les cours :
jaune-bleu et rouge-vert.
• Le questionnaire et la transformation de données
• Le cours a lieu les jeudis de 10h à 12h en salle U300 une
• Analyse des données : semaine sur deux selon le programme et selon le groupe
• Représentations graphiques auquel vous appartenez.
• Les mesures descriptives
• Corrélation et régression linéaire simple
• Questions
• Distribution de l’examen
17 18
• Pour les travaux dirigés (TD), vous serez séparés en • Les travaux pratiques (TP) ont lieu les mercredis de 14h
quatre groupes : jaune, bleu, rouge et vert. à 16h et les jeudis de 16h à 18h.
• Ils ont lieu les mardis de 18h à 20h et les mercredis de • Ils n’y a pas de groupes : chacun peut y aller autant qu’il
12h à 14h une semaine sur deux selon le programme. en a besoin.
• Vous pouvez vous échanger vos groupes en échangeant • Si vous avez des questions, vous les posez en premiers
les programmes de couleurs (ou sur le Forum du cours). aux moniteurs, si ce n’est toujours pas clair vous pouvez
• L’inscription aux TD se fait sur présentation du alors prendre rendez-vous par e-mail avec Katia Iglesias.
programme de couleur.
19 20
Attention Questionnaire
• Si vous avez changé de groupe, ce changement est Pour illustrer les différents concepts qui seront vu dans le
valable aussi bien pour le cours que pour les travaux cours et dans les travaux dirigés, nous utiliserons le
dirigés questionnaire que nous vous avons distribué.
21 22
Session extraordinaire :
Lors de l’examen • Hiver 2007 : examen oral.
• A partir des analyses que vous avez faites à l’avance,
vous devrez répondre aux questions.
• Questions théoriques sur le cours.
23 24
Bibliographie Sites web
Dépelteau, F. (2000), La démarche d’une recherche en sciences Technique d’analyse en psychologie (université de Montréal):
humaines, Ed. De Boeck Université : Bruxelles. http://www.mapageweb.umontreal.ca/cousined/home/course/
PSY1004/index.html
Howell, D.C. (1998). Méthodes statistiques en sciences humaines.
Bruxelles : De Boeck Université. Annexe 6 : Document général :…/PSY1004/3-
FormationSPSS/PSY1004_Annexe6-SPSS.pdf
Kinnear, P., Gray, C. (2005). SPSS facile appliqué à la psychologie et Annexe 7 : SPSS avancé : …/PSY1004_Annexe7-
aux sciences sociales : maîtriser le traitement de données. Bruxelles : SPSS_avancée.pdf
De Boeck Université.
Introduction to SPSS for the PC:
Laveault, D., Grégoire, J. (1997). Introduction aux théories des tests http://abacus.bates.edu/acad/depts/psychology/SPSSPC/sps
en sciences humaines. Ed. De Boeck Université : Bruxelles. spc.html
25 26
Démarche de la recherche
27 28
Construire l’objet de recherche
Circonscrire l’objet de recherche
• Adopter un cadre théorique : La théorie est une sorte
• C’est apprendre à poser et à formuler son de filtre par lequel on regarde la réalité.
questionnement dans le cadre des connaissances
actuelles. • Opérationnaliser ce cadre théorique.
• La recherche s’inscrit dans un continuum et se situe par
rapport à des courants de pensées qui la précèdent et • « traduire une théorie abstraite et une hypothèse
l’influencent. générale en phénomènes concrets et précis qu’on peut
• Monter ce qui rapproche notre recherche des autres et expérimenter, c’est-à-dire observer, toucher, sentir,
ce qui la distingue par rapport à des cadres théoriques goûter ou entendre » (Dépelteau, 2002, p.170)
connus.
29 30
31 32
Construire les instruments d’observation Comment observer ?
• Observer • Questionnaire
• Entretien
« Quoi » : quelles sont les données pertinente ? • Tests
« Qui » : qui ou quoi doit être observé ? • Observation
« Comment » : comment se déroulera le test empirique (mode • Mesures psychophysiologiques
d’investigation) et comment recueillir les données permettant
de tester notre hypothèse de recherche ?
• Imagerie cérébrale
• Evaluation ambulatoire
• Analyse du texte
• Mesures biochimiques
•…
33 34
37 38
39 40
Analyser l’objet d’observation : 3 opérations Analyse statistique
41 42
• degré d’approbation
Échelle Échelle Échelle Échelle de
nominale ordinale d’intervalles rapports pas du tout peu d'accord plutôt tout à fait d'accord
d'accord d'accord
43 44
Variables qualitatives: Assigner des nombres Variables qualitatives: Assigner des nombres
arithmétiques.
45 46
Les modalités ont des valeurs numériques L’échelle d’intervalles (ou continue)
• la température, la taille, le revenu, le quotient intellectuel, le nombre de frères • Pour représenter la différence et l’ordre entre les
sujets. Contrairement à l’échelle ordinale les distances
Variables discrètes : nombre de valeurs possibles entre les valeurs ont un sens.
dénombrable
La température : la différence entre la température aujourd’hui (24°
• le nombre de frères, le nombre de mots dans un texte, le nombre d’accès de
Celsius) et hier (22° Celsius) et la même qu’entre hier (22° Celsius) et
colère dans une semaine
avant-hier (20° Celsius) parce que la différence est la même (2° Celsius).
Variables continues : nombre de valeurs possibles non • Le point zéro est déterminé arbitrairement
dénombrable transformation de la température mesurée en l’échelle Celsius en la
• La température température mesurée en Fahrenheit : Fahrenheit = 9/5 Celsius + 32
47 48
Variables quantitatives : Niveaux de mesure
L’échelle de rapport
La longueur
49 50
51 52
Le questionnaire : Echelle d’ouverture Le questionnaire : données sociodémographiques
53 54
55 56
Du questionnaire à la base de données Du questionnaire à la base de données
• N individus (objets, unités statistiques) qui ont Créer un fichier de données Æ pour cela, il faut élaborer
répondu au questionnaire et utiliser un plan de codage
• P réponses ou variables (caractéristiques, attributs)
par questionnaire
57 58
Tableau de codage pour notre questionnaire Tableau de codage pour notre questionnaire
natio Nationalité 1 allemande 19 roumaine
Variable Variable label Value labels 2 coréenne de sud 20 néerlandaise
id Numéro d’identification 3 mexicaine 21 indienne
exp1 – exp12 Expressivité 1 = jamais ou presque jamais 4 slovaque 22 grecque
2 = parfois 5 italienne 23 israélienne
3 = souvent 6 taiwanaise 24 belge
4 = presque toujours ou toujours 7 finnoise 25 chinoise
bf1 – bf20 Big Five (adjectives) 1 = pas du tout 8 russe 26 marocaine
5 = tout à fait 9 française 27 autrichienne
ouv1-ouv30 Ouverture 1 = pas du tout d’accord 10 polonaise 28 espagnole
5 = tout à fait d’accord 11 tchèque 29 bulgare
loisirs1 – Loisirs 0 = n’a pas ce loisir 12 ukrainienne 30 bolivienne
loisirs8 1 = a ce loisir 13 moldavienne 31 lituanienne
sexe Sexe 1 = Femme 14 usbekienne 32 palestinienne
2 = Homme 15 turque 33 islandaise
age Age 16 Etats-Unis 34 britannique
17 luxembourgeoise 35 croate
18 hongroise 36 suisse
59 60
Tableau de codage pour notre questionnaire
61 62
• Modifier la structure (la forme) d’une variable 8 La manière dont je sens les choses est importante pour moi.
(recodage) Æ modifier la manière dont la variable a 14 Il est rare que j’accorde beaucoup d’attention à mes sentiments du moment.
19 J’éprouve une grande variété d’émotions ou de sentiments.
été initialement codée pour satisfaire aux exigences 24 Je remarque rarement les changements d’humeurs ou les sentiments que
de certaines analyses. provoquent des environnements différents.
27 Je trouve facile d’avoir de l’empathie, c’est-à-dire de ressentir moi-même ce
• Créer une nouvelle variable Æ création d’une nouvelle que les autres ressentent.
63 64
Æ recoder les questions 14 et 24 pour que l’échelle Exemple 2 : restreindre l’échelle
mesure bien l’ouverture aux sentiments
a) Passage de 4 modalités à 2 :
Pour cela, on attribue la valeur 1 à la valeur 5, la valeur 2
à la valeur 4, la valeur 3 à la valeur 3, la valeur 4 à la
Ancienne variable Nouvelle variable
valeur 2 et la valeur 5 à la valeur 1 :
Pas Plutôt pas Plutôt Satisfait Insatisfait satisfait
satisfait satisfait satisfait
Anciennes valeurs Nouvelles valeurs
Etes-vous satisfait 1 2 3 4 Æ 1 2
1 5 avec la manière
dont vous gérez
2 4
vos émotions ?
3 3
4 2
5 1
Missing Missing
65 66
c) Nationalité :
b) Age : variable quantitative allant de 16 à 35 ans
Æ Variable recodée en quatre modalités : 1 allemand 7 finnois 13 moldavien 19 roumain 25 chinois 31 lituanien
2 coréen du sud 8 russe 14 usbekien 20 néerlandais 26 marocain 32 palestinien
3 mexicain 9 français 15 turque 21 indien 27 autrichien 33 islandais
• 16 – 20 ans
4 slovaque 10 polonais 16 Etats-Unis 22 grecque 28 espagnol 34 britannique
5 italien 11 tchèque 17 luxembourgeois 23 israélien 29 bulgare 35 croate
• 21 – 25 ans 6 taiwanais 12 ukrainien 18 hongrois 24 belge 30 bolivien 36 suisse
• 26 – 30 ans
• Ouest de l’Europe : 1, 5, 7, 9, 17, 20, 22, 24, 27, 28, 33, 36
• 31 – 35 ans • Est de l’Europe : 4, 8, 10, 11, 12, 13, 15, 18, 19, 29, 31, 35
• Asie : 2, 6, 14, 15, 21, 23, 25, 32
• Amérique : 3, 16,21, 30
• Afrique : 26
67 68
Créer une nouvelle variable : Ex 1 : une sous-échelle Exemple 2 : l’indice de masse corporelle (IMC)
Pour construire la sous échelle d’ouverture aux L’ « Indice de masse corporelle » s’obtient en divisant le
sentiments, il a fallu dans un premier temps recoder deux poids d’un individu (exprimé en kg) par le carré de sa
des cinq variables mesurant cette dimension. taille (en mètres).
69 70
Description des caractéristiques d’un ensemble Fréquence absolue Fréquence relative Fréquence cumulée
d’observations / d’individus à partir d’une seule variable F1 = f1
73 74
Sexe Age
Cumulative
Cumulative Frequency Percent Valid Percent Percent
Frequency Percent Valid Percent Percent Valid 17 1 .2 .2 .2
Valid Femme 307 63.7 63.7 63.7 18 5 1.0 1.0 1.3
Homme 19 36 7.5 7.5 8.8
175 36.3 36.3 100.0
20 51 10.6 10.6 19.4
Total 482 100.0 100.0 21 66 13.7 13.8 33.1
22 81 16.8 16.9 50.0
Joie 23 50 10.4 10.4 60.4
24 41 8.5 8.5 69.0
Cumulative 25 49 10.2 10.2 79.2
Frequency Percent Valid Percent Percent 26 22 4.6 4.6 83.8
Valid jamais ou 27 25 5.2 5.2 89.0
1 .2 .2 .2
presque jamais 28 15 3.1 3.1 92.1
parfois 25 5.2 5.3 5.5 29 10 2.1 2.1 94.2
souvent 194 40.2 40.8 46.2 30 8 1.7 1.7 95.8
presque toujours 31 5 1.0 1.0 96.9
256 53.1 53.8 100.0 32
ou toujours 4 .8 .8 97.7
Total 33 3 .6 .6 98.3
476 98.8 100.0
35 8 1.7 1.7 100.0
Missing System 6 1.2
Total 480 99.6 100.0
Total 482 100.0 Missing System 2 .4
Total 482 100.0
75 76
Diagramme en bâtons (graphique à colonnes, Diagramme en bâtons
bar plot)
• Une colonne verticale ou
horizontale est dessinée
pour chaque valeur ou
modalité de la variable
considérée
• Hauteur/longueur : nombre
de membres de chaque
classe
77 78
• Cercle : Population
totale
79 80
Histogramme (vars quantitatives continues) Mesure de tendance (centrale)
Pour construire un histogramme, il faut :
• Mode (mode)
• Médiane (median)
• Choisir les intervalles (intervalles qui doivent être de
• Moyenne (mean, average)
mêmes tailles)
• Compter le nombre de cas (observations) dans chaque
intervalle
81 82
Mode Médiane
• La médiane partage la distribution d’une série
• Le mode d’une variable qualitative (ou quantitative
d’observations en deux parties égales.
discrète) est la valeur qui possède la fréquence la plus
• Les variables doivent être mesurées au moins sur une
élevée.
échelle ordinale.
• Il y des distributions unimodale, bimodale, plurimodale • Pour calculer la médiane il faut ordonner les valeurs.
• Calcul :
• Le nombre d’observations est impair : la médiane est la
Effectifs
Effectifs
83 84
Moyenne
• Moyenne arithmétique
• Valeurs individuelles :
xi : valeur individuelle d’un sujet i
n : nombre de sujets
∑x i
x= i =1
85 86
• Variance et écart-type 1 n
s2 = ∑
n i =1
( xi − x ) 2
• Empan
• Intervalle interquartile
• Box plot
Ecart-type (standard error) : s = s2
• Coefficient de symétrie et d’aplatissement
Propriétés
87 88
Variance Empan (étendue, range)
Estimateur de la variance dans une population grâce à un Différence entre la valeur la plus élevée et la valeur la
échantillon : plus base
1 n
σˆ 2 = ∑ ( xi − x )2
n − 1 i =1
89 90
91 92
Box plot
60
Valeurs extrêmes
50 269
40 139 53
1er quartile
181
420
173
27
322
191
280 160
3ème quartile
20
Age
10
N= 307 175
Femme Homme
Sexe
Extrait de M. A. Martin, (2003). Journal of Statistics Education,11
93 94
1'000
1'500
Effectifs
Effectifs
800
Frequency
Frequency
1'000 600
400
500
95 96
Relation entre deux variables
97 98
La corrélation mesure la relation linéaire entre deux Primordial de vérifier la linéarité de la relation, car :
variables • Corrélation linéaire de valeur nulle ne veut pas dire
qu’il n’existe pas de relation entre les variables Æ p.ex.
La corrélation peut prendre des valeurs entre –1 et 1 avec relation quadratique.
• proche de –1 : forte relation négative, • La mesure de la corrélation est très sensible aux
• proche de 0 : pas de relation linéaire et données extrêmes Æ possible d’obtenir une
• proche de 1 : forte relation positive. corrélation linéaire significative même s’il n’y a pas de
relation entre les variables.
99 100
Forte relation linéaire positive Forte relation linéaire négative Pas de relation linéaire, mais relation Pas de relation
101 102
103 104
Corrélation de Bravais-Pearson
Y A B La correlation r de Pearson est une mesure
d’association paramétrique pour deux variables
(x i- x ) < 0
* (x i- x ) > 0
(yi - y ) > 0 * aléatoires continues
(yi - y ) > 0
∑ ( x − x )( y − y )
Y
(yi - y ) < 0
(yi - y ) < 0
*
(x i- x ) < 0 rxy = i i
∑ (x − x) ∑ ( y − y)
*
C (xi- x ) > 0 D 2 2
X X i i
105 106
170
POIDS Corrélation de Pearson
Sig. (bilatérale)
.961**
.000
1
.
Deux variables qualitatives de types ordinales :
N 24 24
**. La corrélation est significative au niveau 0.01
• corrélation de rangs avec les coefficients de corrélation
rhô de Spearman et tau de Kendall.
160
(bil é l)
150
TAILLE
140
40 50 60 70 80 90 100
POIDS
107 108
Corrélation rhô de Spearman Corrélation rhô de Spearman
∑ ( R − R ) ∑ (S − S )
2 2
i i
des rangs, c’est-à-dire remplacez xi par Ri et yi par Si R est la moyenne des valeurs Ri et S est la moyenne des valeurs Si
109 110
Le tau de Kendall est une mesure d’association non On compte combien de segments sont orientés vers le haut
paramétrique basée sur le nombre de concordance et de non et combien sont orientés vers le bas :
concordance dans les pairs d’observations.
111 112
Corrélation tau de Kendall : relation
5.0 Corrélation tau de Kendall : pas de relation
4.0
4.5
3.5
3.0
4.0
Note
Note
2.5
3.5
2.0
3.0
1.5
2.5
1.0
30 40 50 60 70 80 1 2 3 4
Heures travaillées Heures travaillées
113 114
(T0 − T1 )(T0 − T2 )
1,000 ,514**
115 116
Relation négative Régression linéaire simple
Corrélations
Permet de mesurer la relation linéaire entre deux
ouv14 il est rare que
j'accorde beaucoup
d'importance aux
ouv27 je
trouve facile
variables, tout comme la corrélation, mais elle donne une
direction à la relation Æ c’est la VI qui explique, qui est la
sentiments que je de sentir de
ressens l'empathie
Tau-B de Kendall ouv14 il est rare que Coefficient de corrélation
cause de la variation de la VD.
1,000 -,169**
j'accorde beaucoup
d'importance aux Sig. (bilatérale) . ,000
sentiments que je
N 480 478
Le but de cette mesure est de savoir (1) si cette relation
ressens
ouv27 je trouve facile Coefficient de corrélation -,169** 1,000
de sentir de l'empathie
est présente (2) quelle est sa force (quel pourcentage de
Sig. (bilatérale) ,000 .
N 478 480
Rho de Spearman ouv14 il est rare que Coefficient de corrélation
la variance de la VD, la VI peut expliquer) et (3) comment
1,000 -,196**
j'accorde beaucoup
d'importance aux Sig. (bilatérale) . ,000
117 118
• Ex : expliquer le revenu (la VD) par le nombre d’année Linéarité de la relation : comme pour la corrélation, la
d’étude (la VI), cela signifie que nous cherchons à régression mesure la relation linéaire entre deux
connaître le pourcentage de variance du revenu qui variables continues.
peut être expliqué par le fait d’avoir fait peu ou
beaucoup d’étude.
119 120
Régression linéaire simple : R-deux ajusté
variable indépendante.
5
note
• proche de 1 : la valeur VI prédit presque exactement expliquée totale=
variance(note)
la valeur de la VD.
3
0 20 40 60 80 100 120
Heures travaillées
121 122
123 124
1) La statistique inférencielle nous dirait si on peut Le tableau ci-dessous permet d’écrire l’équation de régression
affirmer que la relation est significative (cours Stat qui exprime la relation linéaire existant entre la VD et la VI :
II). Note = -27.090 + 21.750*nb d’heure de travail
2) Combien le nombre d’heures de travail explique de Coefficientsa
125 126
A (DE POSITION)
R
AEDnote
Variance
3
INDICES DE
Ecart interquartile Ecart-type
VARIABILITE Coefficient de variation
2
(DE DISPERSION)
2
INDICES Coefficient rho Coefficient r de Bravais-
1
Analyse de régression
0 20 40 60 80 100 120
Kendall
AEDheurestrav
127 128
Travaux Dirigés
et
Travaux Pratiques
1
Table des matières
TD1 : Découverte de SPSS ........................................................................................................ 4
Qu’est-ce que SPSS ? ............................................................................................................. 4
Comment démarrer SPSS....................................................................................................... 4
L’éditeur de données .............................................................................................................. 5
Menu File : Ouvrir un fichier de données avec SPSS ............................................................ 6
Menu File : Obtenir les informations sur les variables dans un format imprimable .............. 9
Menu File : Ouvrir et sauvegarder des fichier de données..................................................... 9
Informations compactes sur les variables dans un fichier de données ................................... 9
Les différentes fenêtres de SPSS.......................................................................................... 10
Fenêtre de données (Data Editor)..................................................................................... 10
Fenêtre des résultats (Output Editor) ............................................................................... 10
Fenêtre de syntaxe (Syntax Editor) .................................................................................. 10
Menu Graphs : refaire le graphe du cours ............................................................................ 11
Menu Help............................................................................................................................ 13
TD2 : Entrer les données à partir du questionnaire .................................................................. 15
Entrer les données directement dans SPSS .......................................................................... 15
Encoder le questionnaire .................................................................................................. 15
Créer un nouveau fichier de données dans SPSS............................................................. 16
Comment coder les variables alphanumériques/série de caractères ?.............................. 18
Comment coder les réponses à réponses courtes ?........................................................... 18
Comment coder les réponses multiples ? ......................................................................... 18
Comment coder les réponses ouvertes ?........................................................................... 18
Comment coder les valeurs manquantes ? ....................................................................... 19
Conseil et remarques ........................................................................................................ 19
Réduire les erreurs en entrant les données ....................................................................... 19
Eliminer et insérer des observations/variables dans la vue de données ........................... 19
Fusionner des fichiers de données.................................................................................... 20
Ajouter des observations .............................................................................................. 20
Ajouter des variables.................................................................................................... 21
Utiliser Excel pour entrer les données dans SPSS ............................................................... 22
Créer une grille de données avec Excel............................................................................ 22
Importer les données dans SPSS ...................................................................................... 22
Utiliser un fichier texte pour entrer les données dans SPSS ................................................ 23
Créer une grille de données avec un fichier texte ............................................................ 23
Importer les données dans SPSS ...................................................................................... 23
Eliminer les erreurs de l’entrée de données.......................................................................... 24
TP2 : Entrées les données à partir du questionnaire................................................................. 25
Exercice 1: Entrer les données ............................................................................................. 25
Exercice 2: Fusionner les données et éliminer les erreurs ................................................... 25
A. Fusionner les données ................................................................................................. 25
B. Eliminer les erreurs...................................................................................................... 25
TD3 : Préparation des données : Transformer les données ...................................................... 26
Transformer les données ...................................................................................................... 26
Recoder des variables....................................................................................................... 26
Construire des indicateurs ................................................................................................ 27
Transformer les données en utilisant la page de syntaxe ................................................. 28
2
TP3 : Préparation des données : Transformer les données....................................................... 29
Exercice 3: Créer de nouveaux indicateurs .......................................................................... 29
Exercice 4 : Recoder et créer de nouvelles variables ........................................................... 30
Exercice 5 : Ajouter des variables........................................................................................ 30
TD4 : Analyse des données : Représentations graphiques....................................................... 31
Fréquences............................................................................................................................ 31
Graphiques pour les variables nominales et ordinales (montrant les fréquences) ............... 32
Bar (bâtons): ..................................................................................................................... 32
Distribution des fréquences d'une variable.................................................................. 32
Distribution des fréquences d'une variable par sous-groupes..................................... 33
Pie (Camembert) .............................................................................................................. 34
Graphiques pour les variables métriques ............................................................................. 34
Histogramme .................................................................................................................... 34
Modifier les caractéristiques d'un graphique........................................................................ 35
Exporter des tableaux et des graphiques dans Word............................................................ 36
TP4 : Analyse des données : Représentations graphiques ....................................................... 36
Exercice 6 : Distributions des variables ............................................................................... 36
TD5 : Analyse des données : Mesures descriptives ................................................................. 37
Mesures descriptives ............................................................................................................ 37
Graphiques des mesures descriptives ................................................................................... 38
Bar (bâtons) ...................................................................................................................... 38
Error bar ........................................................................................................................... 41
Boxplot ................................................................................................................................. 43
Modifier la présentation des résultats (Output Labels) ........................................................ 44
Sélectionner des cas ............................................................................................................. 45
Comparer les groupes........................................................................................................... 45
TP5 : Analyse des données : Mesures descriptives.................................................................. 45
Exercice 7 : Distributions des variables ............................................................................... 45
Exercice 8 : Sélectionner et comparer les groupes............................................................... 46
TD6 : Analyse des données : Corrélation et régression ........................................................... 47
Corrélation de rang............................................................................................................... 47
Scatterplot............................................................................................................................. 47
Corrélation de Bravais-Pearson............................................................................................ 48
Régression linéaire simple ................................................................................................... 49
Syntaxe : ........................................................................................................................... 49
SPSS-Viewer (Résultat) ................................................................................................... 49
TP6 : Analyse des données : Corrélation et régression ............................................................ 51
Exercice 9 corrélation de rang.............................................................................................. 51
Exercice 10 corrélation et régression linéaire simple........................................................... 51
3
TD1 : Découverte de SPSS
Qu’est-ce que SPSS ?
SPSS signifie « Statistical Package for the Social Sciences ». Son objectif est d'offrir un
logiciel permettant de réaliser la totalité des analyses statistiques habituellement utilisées en
sciences humaines. C’est un logiciel très complet et dans ce cours, nous ne verrons qu'une très
faible partie de ses possibilités. Il existe bien d’autres logiciels comme S-Plus, R ou SAS qui
permettent d’atteindre les mêmes buts, c’est-à-dire faire des analyses statistiques.
Figure 1
Lorsque SPSS démarre, il ouvre une fenêtre principale qui ressemble un peu à une feuille
Excel. Il ouvre devant cette grille, une boîte de dialogue (Figure 2) permettant : d’ouvrir un
jeu de données SPSS ou dans un autre format, de créer un nouveau jeu de données, etc. On
peut soit utiliser cette boîte de dialogue, soit juste cliquer sur « Cancel », car nous pouvons
faire exactement les mêmes manipulations directement à l’intérieur de SPSS.
4
Figure 2
L’éditeur de données
Une fois cette boîte de dialogue fermée, nous voyons l’éditeur de donnée. L’éditeur de
données contient la grille (matrice) de données (vue des données = « Data View ») et les
descriptions des variables (vue des variables = « Variable View »).
5
Figure 3
Dans la partie supérieure de l’éditeur de données nous avons, comme dans Word et Excel, des
menus déroulants :
Figure 4
File: … (TP1)
Edit: … (TP1)
View: … (TP1)
Data: … (TP1)
Transform: … (TP3)
Analyze: … (TP5 et TP6)
Graphs: … (TP4)
Utilities: … (TP1)
Window: … (TP1)
Help: … (TP1)
Pour ouvrir un fichier de données SPSS (extension .sav), nous allons utiliser les menus
déroulant. Cliquer sur « File », puis sur « Open » et finalement sur « Data … ». Là, vous
pouvez chercher votre fichier dans le répertoire où vous l’avez enregistré.
6
Figure 5
Une fois nos données ouvertes, nous pouvons explorer les deux affichages mentionnés en
dessus : l’affichage des données (« Data View ») et l’affichage des variables (« Variable
View ») :
Figure 6
7
Vue des variables :
Figure 7
Name: nom de la variable
• le nom de la variable doit être unique
• max 8 caractères (à partir de la version SPSS 12, on peut utiliser plus de caractères :
max. 64 !)
• débutant par une lettre
• les autres caractères peuvent être une lettre, un chiffre, un point ou les symbols @ _ #
$ (tous les autres symbols sont interdits)
• Le nom ne peut pas se terminer par un point
• les espaces vides ne sont pas possibles
• majuscules et minuscules ne sont pas différenciés dans l’appellation d’une variable ou
dans celui d’un fichier
• les mots clé de SPSS ne peuvent pas être utilisés (all, and, by, eq, ge, gt, le, lt, ne, not,
or, to, with)
• Ne pas mettre de lettre accentuée même si c’est possible
8
è Attention : Width et Decimals définissent le format des données dans la grille
de données – la donnée apparaissant dans une cellule peut différer de la donnée
exacte (qui est utilisé par SPSS pour les opérations de calcul et qui est visible
dans la cellule blanche au-dessous la barre d’outils pour la cellule « active »)
è Attention : « none » ne signifie pas qu’il n’y a pas de valeurs manquantes dans
les données, ça signifie qu’il n’y a pas de valeurs manquantes définit par
l’utilisateur. Par contre, il est possible d’avoir des valeurs system
missing (correspond aux cellules vides dans la grille de données).
Columns: largeur des colonnes dans la vue de données (en augmentant/diminuant le défaut
« 8 », plus/moins de caractères de la colonne seront visibles dans la vue de données)
Align : Alignement des valeurs des variables dans les cellules de la grille de données (à
droite, à gauche, centrées)
è Attention : n’a pas d’influence sur le type d’analyse qu’on peut effectuer avec
SPSS !!!
Menu File : Obtenir les informations sur les variables dans un format imprimable
Pour obtenir toutes les informations sur les variables dans un format imprimable, il faut
cliquer sur File | Display data file information | Working file. Les informations sont
transférées dans une nouvelle fenêtre (SPSS Viewer). Cette page des résultats peut être
sauvegardée et/ou imprimée. Les éléments peuvent être copiés et collés dans un document
géré par un autre logiciel (p.ex. Word). Le fichier des résultats (Output Editor) porte
l’extension « .spo ».
Dans le menu « File », on trouve toutes les commandes pour gérer les fichiers SPSS (ouvrir,
sauvegarder, sauvegarder sous...) – pareil aux autres logiciels Windows (p.ex. Word)
Menu Utilities: Dans le menu Utilities | Variables on peut consulter les caractéristiques de
toutes les variables. Quand vous travaillez avec un fichier avec beaucoup de variables, cette
9
option a l’avantage de trouver des variables en tapant les premières lettres du nom de la
variable. En appuyant sur le bouton « Go to » on arrive à la variable cherchée dans la vue de
données.
Menu Edit : en général, il est plus facile de trouver des variables dans les listes des boîtes-
dialogue quand elles sont affichées par leur nom (variable name) et pas par leur étiquette
(variable label). En plus, il est recommandé de choisir le même ordre que dans le fichier (au
lieu d’un ordre alphabétique). Pour cela, il faut aller sous Edit | Options: General, Variable
list : Display names (au lieu de labels), File (au lieu de alphabetical).
Menu View : pour passer de la vue des données à la vue des variables et vice versa, il faut
cliquer sur Variable View (respectivement « Data View ») dans le coin inférieur gauche de la
grille des données ou via le menu View | Variable (respectivement Data)
Cette fenêtre permet d'entrer des données, de les modifier ou de les effacer. Il est rare que l'on
tape les données manuellement dans SPSS car il y a trop d'erreurs de saisie possibles (on
reviendra sur ce point dans le TP2). On va plutôt ouvrir un fichier déjà existant.
Cette fenêtre apparaît après qu’une commande d’analyse a été effectuée, et contient les
résultats de cette analyse. Les résultats apparaissent à droite dans la fenêtre. A gauche, figure
une table des matières des résultats générés par SPSS.
Les résultats peuvent être imprimés tels quels (mais avec le risque de voir un tableau
s’imprimer sur plusieurs pages. Il est également possible de copier les tableaux qui nous
intéressent pour les coller ensuite dans Word, Excel ou dans un autre logiciel. Il est possible
de copier un tableau de deux manières. En cliquant sur le tableau en appuyant sur le bouton de
droite de la souris, SPSS vous propose de copier (copy) ou de copier l’objet (copy object).
Copier correspond à copier les valeurs, mais lorsqu’il est collé il peut perdre son format (utile
pour copier les résultats dans une feuille Excel par exemple). Copier les objets corresponds à
copier les valeurs et le format du tableau : une fois collé, impossible de modifier les cellules
du tableau (utile pour copier les résultats dans Word).
Parfois, le résultat est très long et SPSS n'en montre qu'une partie, suivi d'un triangle rouge.
Pour visualiser la suite, il faut double-cliquer sur le texte, puis étendre la taille de la zone de
texte vers le bas jusqu'à ce que vous ne voyez plus de texte.
Jusqu’à maintenant, nous avons vu comment travailler avec les menus déroulant. Il existe une
autre manière de lancer des analyse : passer par la fenêtre de syntaxe. Cette fenêtre permet
d’écrire les commandes d’analyses statistiques. Elle fonctionne comme un traitement de texte
simple.
10
Mais pourquoi s’amuser à taper les analyses quand il suffit de faire défiler des menus et
cliquer sur des icônes ? Parce que lorsqu’on veut refaire une analyse qu’on a déjà effectuée et
juste changer un paramètre, il suffit de reprendre la feuille de syntaxe de l’analyse précédente,
changer un mot et renvoyer l’analyse. Sinon, il faudrait recommencer toute l’analyse de A à
Z, vu qu’on ne peut pas enregistrer la séquence de clics. De plus, les menus ne donnent pas
accès à toutes les commandes SPSS. Finalement, c’est aussi utile pour faire la même analyse
sur plusieurs fichiers de données.
Ainsi, une fois la syntaxe faite pour une opération, il est facile d’enregistrer les commandes et
de les réutiliser pour différents fichiers de données.
Voici les règles générales pour écrire des commandes dans SPSS :
Pour exécuter une commande, il faut sélectionner la commande à exécuter puis choisir dans le
menu « Run : Current » ou encore Ctrl-R ou encore utiliser le bouton ‘run’ (? ).
Vous pouvez enregistrer votre script pour le modifier plus tard (menu File | Save). Vous
pouvez aussi enregistrer la fenêtre de résultats bien que très souvent, il en résulte un fichier
énorme (que vous ne pourrez sauvegarder sur une disquette). Cependant, tant et aussi
longtemps que vous avec votre syntaxe et vos données, vous pouvez toujours exécuter la
syntaxe à nouveau pour revoir les résultats.
Le menu graphique permet de générer en quelques cliques de souris toute une panoplie de
graphiques. Nous reviendrons plus en détail lors du TD 4.
Lors du cours, on vous a présenté les résultats d’une recherche mettant en avant (entre autre)
le lien entre la satisfaction des relations avec sa mère et la fréquence des relations sexuelles
pour des adolescents noirs de quartiers défavorisés de Philadelphie âgés de 14 à 17 ans.
11
Figure 8
2.50
2.00
1.50
sexfreq
1.00
0.50
0.00
satisf
Figure 9
12
Menu Help
SPSS offre plusieurs niveaux d’aide (extrait tiré de l’aide de SPSS pour Windows 13.0 en
français):
Figure 10
Menu Aide : Le menu Aide de la plupart des fenêtres SPSS permet d'accéder au système
d'aide principal, ainsi qu'aux didacticiels et aux informations de référence technique.
13
Aide sensible au contexte : Plusieurs emplacements de l'interface utilisateur vous permettent
d'accéder à l'aide contextuelle.
• Boutons Aide de boîte de dialogue : La plupart des boîtes de dialogue disposent d'un
bouton Help qui vous conduit directement à la rubrique d'aide relative à la boîte de
dialogue. La rubrique d'aide fournit des informations générales et propose des liens
vers les rubriques apparentées.
• Aide du menu contextuel de la boîte de dialogue : De nombreuses boîtes de dialogue
fournissent une aide contextuelle pour les commandes et les fonctions. Cliquez avec le
bouton droit sur n'importe quel contrôle d'une boîte de dialogue et sélectionnez
What’s this ? dans le menu contextuel. Une description du contrôle s'affiche alors,
ainsi que son mode d'utilisation. (Si What’s this ? n'apparaît pas dans le menu
contextuel, ce type d'aide n'est pas disponible pour cette boîte de dialogue.)
• Aide du menu contextuel du tableau pivotant : Cliquez sur le bouton droit de la souris
sur les termes du tableau pivotant dans le Viewer et sélectionnez What’s this ? dans le
menu contextuel afin d'afficher les définitions de ces termes.
• Etudes de cas : Cliquez avec le bouton droit de la souris sur un tableau pivotant, puis
sélectionnez Case Studies dans le menu contextuel pour accéder directement à un
exemple détaillé relatif à la procédure qui a généré ce tableau. (Si Case Studies
n'apparaît pas dans le menu contextuel, ce type d'aide n'est pas disponible pour cette
procédure.)
14
TD2 : Entrer les données à partir du questionnaire
Il y a plusieurs manières d'entrer les données :
Encoder le questionnaire
Il est recommandé de résumer les informations les plus importantes sur les variables
rassemblées dans un « tableau de codage ». Ce tableau de codage à deux utilités à deux
moments bien précis :
• Pendant l’entrée des données : comme règle de codage des valeurs des variables
• Après l’entrée des données : comme description compacte du fichier des données
15
Tableau de codage pour notre questionnaire
Variable Variable label Value labels
id Numéro d’identification
exp1 – exp12 Expressivité * 1 = jamais ou presque jamais
2 = parfois
3 = souvent
4 = presque toujours ou toujours
bf1 – bf20 Big Five (adjectives) * 1 = pas du tout
5 = tout à fait
ouv1-ouv30 Ouverture * 1 = pas du tout d’accord
5 = tout à fait d’accord
loisirs1 – loisirs8 Loisirs * 0 = n’a pas ce loisir
1 = a ce loisir
sexe Sexe 1 = Femme
2 = Homme
age Age
natio Nationalité 1 allemande 19 roumaine
2 coréenne de sud 20 néerlandaise
3 mexicaine 21 indienne
4 slovaque 22 grecque
5 italienne 23 israélienne
6 taiwanaise 24 belge
7 finnoise 25 chinoise
8 russe 26 marocaine
9 française 27 autrichienne
10 polonaise 28 espagnole
11 tchèque 29 bulgare
12 ukrainienne 30 bolivienne
13 moldavienne 31 lituanienne
14 usbekienne 32 palestinienne
15 turque 33 islandaise
16 Etats-Unis 34 britannique
17 luxembourgeoise 35 croate
18 hongroise 36 suisse
etude Domaine d’études 1 mathématique 10 économie
2 psychologie 11 histoire
3 droit 12 architecture
4 langues 13 design
5 géologie 14 informatique
6 éducation 15 médias
7 ingénierie 16 théologie
8 politique 17 philosophie
9 sociologie 18 ethnologie
code Code
* Pour une vue générale sur les variables qui sont mesurées dans une étude, il suffit de donner le nom du
questionnaire dans le tableau de codage (p.e.x, « Big Five » pour les 20 items). Dans le fichier SPSS, on peut
entrer le contenu de chaque item dans « Variable label » (p.ex., bf1: « amical », bf2: « chaleureux »).
• Lorsqu’on démarre SPSS, une fenêtre « What would you like to do ? » apparaît par
défaut (cf. TD1). On sélectionne « Type in data » et on obtient un éditeur de données
vide.
16
• Si on se trouve déjà dans l’éditeur des données (p. ex., un autre fichier de données est
ouvert), il faut cliquer sur File | New | Data
• Une fois l’éditeur de données ouvert, il faut définir les variables dans la vue des
variables (Variable View). Pour cela on va s’aider du tableau de codage qu’on a déjà
créé à partir de notre questionnaire.
• On commence avec le nom de la première variable. Pour passer à la cellule suivante,
appuyez sur TAB ou →.
• Vous pouvez attribuer une ou toutes les caractéristiques d’une variable à une ou
plusieurs autres variables !
è Une caractéristique : Copiez la cellule (en cliquant droit : Copy, ou en cliquant
sur le menu Edit | Copy) et collez à une ou plusieurs autres cellules (en
cliquant droit : Past, ou en cliquant sur le menu Edit | Past)
è Toutes les caractéristiques d’une variable : Copiez et collez toute la variable
(en cliquant sur le numéro de la ligne, ce qui la grise)
• La seule chose qui ne peut pas être copiée, c’est le nom d’une variable, parce que
chaque variable doit avoir un nom unique, comme mentionné précédemment. C’est
pour ça que SPSS nomme une variable nouvelles var00001 (que l’on renomme après)
• Pour créer plusieurs nouvelles variables avec le même radical dans leur nom
(par exemple bf1, bf2, …, bf20), il faut
• Entrez la variable bf1 avec son type, son étiquette, etc. (vue : Data View)
• Copiez cette variable.
• Sélectionnez la ligne du dessous de la variable et cliquez sur le bouton de
droite de la souris.
• Sélectionnez « Copy variables ».
• Dans la boîte de dialogue qui apparaît entrez le nombre de nouvelles variables
à créer ici 19 (20 variables big five moins une déjà entrée), leur radical (nom
des nouvelles variables : bf) et le numéro de la première variable qui suivra le
radical (2, car on a déjà créer bf1).
Figure 11
17
Comment coder les variables alphanumériques/série de caractères ?
Solution : entrez les caractères et définissez la variable comme chaîne de caractère (String)
Exemple :
Quelle est votre nationalité ? _______________
Solution : Codez les réponses ouvertes avec des valeurs numérique (1 = suisse, 2 = française,
etc.) en faisant une liste
Exemple :
Quelles occupations/loisirs avez-vous régulièrement? (plusieurs réponses sont possibles)
e
q Activités culturelles (expositions, concerts, lecture, université 3 âge, etc.)
q Activités physiques (natation, marche, club de sport, etc.)
q Bricolage (tricot, jardinage, etc.)
q Animal domestique
q Instrument de musique
q Internet, e-mail
q Autre : _____________________________________________________
Solution :
• Créez une variable pour chaque catégorie (p.ex, loisir1 – loisir6), codé par
0 = n’a pas ce loisir, 1 = a ce loisir
• Pour les réponses ouvertes (« autre : »), créez soit une variable alphanumérique
(Chaîne de caractère), p.ex. add_lois, soit une variable numérique en faisant une liste
des loisirs qui apparaissent
Exemple :
Qu’est ce que ces loisirs vous apportent ?
Solution :
• regrouper l’information en catégorie grâce à l’analyse de contenu. Technique que nous
ne verrons pas dans ce cours.
• Donc, pour ce cours, nous laisserons de côté cette question du questionnaire.
18
Comment coder les valeurs manquantes ?
• Dès qu’on a entré une donnée, toutes les cellules des autres variables numériques de ce
cas sont désignés par un point (= « Sysmis », system defined missing) qui est
remplacé quand on entre une valeur. Garder le point dans la cellule signifie que la
valeur pour cette cellule est manquante et ce type de donnée manquante n’a pas à être
définie comme telle car elle est reconnue automatiquement par SPSS comme valeur
manquante.
• Garder la cellule vierge pour les variables alphanumériques n’est pas considéré par
SPSS comme valeur manquante. Il faut la définir comme telle dans la vue des
variables. Pour cela, entrez un espace dans « discret missing values ».
• Entrer un chiffre en dehors de l’étendue de valeurs valables (p. ex. 9 ou 99). Il faut
définir ces valeurs dans la vue des variables. Pour cela, entrez un espace dans
« discret missing values ».
Conseil et remarques
• Entrez toujours les données « brutes » telles qu’elles sont. Par exemple, il ne faut pas
recoder à la main un item (recodage ou transformation (cf TD3)).
• Si vous avez un format de réponse bipolaire avec des valeurs positives et négatives, il
est préférable d’utiliser un codage avec uniquement des valeurs positives. Mais il est
important d’avoir définit cela dans le tableau de codage du questionnaire.
Format de réponse: −− − 0 + ++
sujet à erreur: -2 -1 0 1 2
mieux: 1 2 3 4 5
19
Fusionner des fichiers de données
On a deux fichiers contenant des variables similaires, mais des observations différentes (par
exemple, saisie d‘une moitié des questionnaires par Paul et saisie de l’autre moitié par Pierre
avec pour but d’avoir un et un seul fichier à la fin). Pour cela il faut ouvrir le premier fichier,
c’est-à-dire celui qui sera pour nous notre fichier de travail. A partir du menu, faites Data |
Merge files | Add cases : cherchez votre deuxième fichier.
La boîte de dialogue qui apparaît vérifie si les deux fichiers contiennent les mêmes variables
(avec les mêmes noms1). Par défaut, toutes les variables de même nom seront incluses
Si ce n’est pas le cas, les variables non appariées se trouvent dans la section « Unpaired
Variables ».
Figure 12
Les variables qui apparaissent seulement dans un fichier de données peuvent quand même être
ajoutées en appuyant sur í (les cas de l’autre fichier qui n’ont pas de valeurs à ces variables
reçoivent des valeurs manquantes = Sysmis)
S’il y a des variables dans les deux fichiers qui mesurent la même chose mais qui ne portent
pas le même nom (p.ex. par erreur), on peut les apparier. Pour faire cela, il faut sélectionner
les deux variables (on sélectionne la deuxième variable en pressant sur la touche CTRL), puis
appuyer sur « Paired », on obtient ainsi dans « Variables in new working data file », une
nouvelle variable qui se nomme var1 & var2 (dans le fichier fusionné, la variable portera le
nom du premier fichier (le fichier de travail)).
1
Attention, il est important que le nom des variables, ainsi que le type, l’étiquette et les valeurs et les données
manquantes soient définis exactement de la même manière dans les deux fichiers, sinon SPSS définira une
variable avec même nom comme « Unpaired variables » (fenêtre de gauche) à toujours vérifier que les
variables communes aux deux fichiers qui nous intéressent se trouvent bien dans « Variables in new working
data file ».
20
Une fois toutes les variables qui nous intéressent sélectionnées, il faut cliquer sur ok, ce qui
ajoute les observations du deuxième fichier au premier. On a maintenant un nouveau fichier
de données. Si nous sauvons ce fichier en faisant File | Save, cela va écraser le premier
fichier. Ce qu’il faut faire c’est File | Save as et on obtient ainsi une nouvelle base de
données, différentes des deux initialement utilisées pour sa création.
Si on a deux fichiers contenant les mêmes sujets, mais avec des variables différentes (par
exemple, deux expériences différentes avec le même groupe de sujets avec pour but d’avoir
des informations supplémentaires sur nos sujets venant de l’autre expérience). Pour cela il
faut ouvrir le premier fichier, c’est-à-dire celui qui sera pour nous notre fichier de travail. A
partir du menu, faites Data | Merge files | Add variables : cherchez votre deuxième fichier.
Pour pouvoir effectuer cette manipulation, il faut impérativement avoir une variable « clé »
pour identifier les différentes observations (p. ex. par un code) et pouvoir fusionner les
données. Les valeurs de cette variable clé doivent être identiques (p.ex. une variable
alphanumérique doit être entrée de la même façon – par rapport aux majuscules/minuscules et
nombre de caractères – attention aux espaces après les derniers caractères !)
• Triez les observations selon la variable clé dans tous les fichiers qu’on veut fusionner :
Data | Sort cases.
• Ouvrez le premier fichier et faites Data | Merge files | Add variables: choisissez le
deuxième fichier
• Dans la boîte de dialogue qui apparaît, cochez « Match cases on key variables in
sorted files » - « Les deux fichiers fournissent des observations ». Il faut sélectionner
la variable clé (key variable) d’appariement dans la section de gauche et appuyer sur
í.
Figure 13
Une fois toutes les variables qui nous intéressent sélectionnées, il faut cliquer sur ok, ce qui
ajoute les variables du deuxième fichier sélectionnées au premier. On a maintenant un
nouveau fichier de données. Si nous sauvons ce fichier en faisant File | Save, cela va écraser
le premier fichier. Il est beaucoup plus prudent de sélectionner File | Save as ... On obtient
ainsi une nouvelle base de données, différentes des deux initialement utilisées pour sa
création.
21
Utiliser Excel pour entrer les données dans SPSS
Figure 14
• Sélectionnez la ou les feuilles Excel où se trouvent les données dont vous avez besoin
en faisant glisser les feuilles ou les variables dans les feuilles qui nous intéressent dans
la fenêtre de gauche vers la fenêtre de droite. Puis cliquez sur suivant.
Figure 15
22
• Définir les variables : type des variables, étiquettes, valeurs, etc.
Figure 16
• Terminer et Sauvegardez les données (File | Save as…) comme fichier SPSS
(extension .sav).
23
Eliminer les erreurs de l’entrée de données
Deux types d’erreurs possibles : a) la valeur fausse est une valeur dans l’étendue des valeurs
valables ou b) la valeur fausse est une valeur dehors de l’étendue des valeurs valables.
On peut repérer les erreurs du type (a) qu’en comparant les données vraies avec les données
entrées. Mais cela est très coûteux, d’où l’importance d’être très minutieux en entrant les
données ! Donc seules les erreurs de type (b) peuvent être repérées et éliminées après l’entrée
des données.
Pour cela, il faut inspecter les valeurs minimales et maximales de toutes les variables en
passant par Analyze | Descriptive Statistics | Frequencies. Il faut sélectionner toutes les
variables numériques (en utilisant la souris ou les touches SHIFT et ↓) et ajoutez-les dans la
section droite í, puis cliquez dans « Statistics », choisissez « Minimum » et « Maximum »
Figure 17
Dans la page des résultats, le tableau « frequencies » peut être pivoté en double-cliquant sur
le tableau et cliquant sur le menu Pivot | Transpose rows and columns ce qui rend le tableau
plus facile à lire.
• Vérifier combien de valeurs sont fausses : pour chaque variable ayant un minimum
trop petit ou un maximum trop grand. Pour cela, il faut inspecter les tableaux de
fréquences pour les variables ayant des valeurs erronées et noter le nombre de ces
valeurs et leurs valeurs numériques.
• Corriger les valeurs fausses dans la vue des données : pour cela il faut trouver la
variable p. ex. à l’aide du menu Utilities | Variables … « go to » et la sélectionner.
Puis allez dans Edit | Find et entrez la valeur fausse que vous cherchez et cliquez sur
« Find next ». Activez la cellule. Ensuite, cliquez sur le menu Utilities | Variables,
24
choisissez la variable d’identification et cliquez sur « Go to » : la cellule montre le
numéro du cas cherché.
• Vérifiez la valeur correcte dans les documents (p. ex., questionnaire) de ce cas et
corrigez-la dans la base de données
è Attention: Après avoir trouvé la cellule avec une valeur fausse, il semble peut-
être plus facile de noter le numéro de la ligne dans la grille de données (au lieu
d’aller via le menu). Mais le numéro de la ligne ne doit pas être identique avec
le numéro d’identification du cas !!! (p. ex. si le fichier a été trié par une autre
variable ou si la variable d’identification a des valeurs manquantes)
Préparez l'entrée des données en définissant les variables dans la vue des variables.
Vous avez en votre possession 2 exemplaires du questionnaire remplis. Entrez ces données
dans la vue des données.
Créez un classeur « exercices » dans votre domaine (h:\…) et enregistrez-y le fichier sous le
nom « exercice1.sav ».
Deux étudiants ont entré ensemble des données d’une étude – chacun a entré environ la moitié
des questionnaires. Les données se trouvent dans deux fichiers qui se trouvent sur dokeos.
Fusionnez-les.
Corrigez les erreurs* et sauvegardez le fichier sous le nom « exercice2b.sav » dans votre
domaine (h:\…).
25
TD3 : Préparation des données : Transformer les données
Transformer les données
Avant d’effectuer des analyses statistiques, il est souvent nécessaire de modifier les données
brutes :
• recoder des items (regrouper des catégories, inverser le sens de l’échelle, etc.),
• construire des indicateurs (calculer des scores d’échelles, des sous échelles, centrer et
réduire un variable, etc.).
• Après avoir éliminé les erreurs, gardez toujours un fichier des données brutes.
• Avant d’effectuer des modifications, sauvegardez les données sous un autre nom pour
conserver le fichier original!
• Toutes les variables initiales restent dans le fichier. Les variables recodées obtiennent
un nouveau nom.
Pour recoder une variable que ce soit pour regrouper des catégories ou inverser le sens de
l’échelle, il faut passer par Transform | Recode | into different variables. Il faut éviter
d’utiliser Recode | into same variables, parce que cette option écraserait votre variable
initiale.
Figure 18
26
Dans Output variable, on peut choisir le nouveau nom de la variable, ainsi que l’étiquette de
la variable. Puis on sélectionne « change » pour que SPSS puisse faire le lien entre l’ancienne
et la nouvelle variable (ouv02 à ouv02r). Puis on sélectionne « Old and new values ». Une
nouvelle boîte de dialogue s’ouvre où l’on peut préciser l'ancienne valeur à gauche et la
nouvelle valeur à droite. A chaque changement de valeur, il faut appuyer sur « Add ».
Lorsqu’il y a des valeurs manquantes dans notre variable initiale, si rien n’est spécifié, alors
SPSS attribuera également des valeurs manquantes (sysmis) à la nouvelle variable.
Lorsque dans un questionnaire plusieurs variables d’une échelle sont codées dans le sens
inverse des autres (par exemple ouv02 est un élément de l’échelle de mesure de l’ouverture,
avec 1 pas du tout ouvert à 5 tout à fait ouvert, mais ouv02 (je suis bien installé dans mes
habitudes) va de 1 tout à fait ouvert à 5 pas du tout ouvert), il est possible de recoder toutes les
variables dont l’échelle est inversée pour une même dimension en une seule fois.
Pour construire une nouvelle variable à partir de plusieurs variables de départ, il faut passer
par Transform | Compute. Une manière usuelle pour agréger différente variable, c’est
d’utiliser la moyenne ou la somme des différentes variables initiales. Pour construire la sous-
échelle d’expression de joie, nous allons utiliser la moyenne des deux éléments qui composent
cette sous échelle : exp02 (joie) et exp08 (bonheur).
Figure 19
27
bas à droite dans « functions and special variables ». En cliquant sur une des fonctions, on
obtient au centre de la boîte de dialogue une explication de ce que fait l’opération choisie et
comment rentrer les variables initiales (qui se trouvent à gauche dans la boîte).
Attention: On pourrait aussi calculer la somme de tous les items d’une échelle (Sum).
Cependant, il n’est pas évident comment gérer les valeurs manquantes en créant la somme des
items – si on enlève tous les cas avec les valeurs manquantes on risque de fortement diminuer
l’échantillon. Le remplacement des valeurs manquantes par la moyenne de l’échantillon est
aussi problématique! C’est pour cela que calculer la moyenne est recommandé.
• Dans la boîte de dialogue d’un menu Transform | ... appuyez sur le bouton « Paste »
au lieu de « Ok ». La commande exécutée s’inscrira sur la page de syntaxe.
• La syntaxe est un fichier de texte qui peut être sauvegardé (extension .sps) et imprimé.
Les commandes peuvent être copiées, collées et changées.
• On peut ajouter du texte commentaire qui doit être précédé d’un astérisque et suivi par
un point.
• Pour exécuter les commandes, on la sélectionne et on envoie la syntaxe en appuyant
sur le bouton í.
Figure 20
28
Pourquoi travailler avec la page de syntaxe (cf TD1) :
Créez des scores d’échelles représentant les dimensions de l’expressivité des émotions et les
dimensions des « Big Five » :
Amour (exp_amo) : moyenne de exp01, exp07 Extraversion (bf_ext): moyenne de bf01, bf06, bf13, bf16
Joie (exp_joi): moyenne de exp02, exp08 Agréabilité (bf_agr): moyenne de bf02, bf08, bf15, bf17
Peur (exp_peu) : moyenne de exp03, exp09 Conscience (bf_con): moyenne de bf03, bf07, bf11, bf20
Colère (exp_col) : moyenne de exp04, exp10 Névrosisme (bf_nev): moyenne de bf04, bf10, bf12, bf19
Tristesse (exp_tri) : moyenne de exp06, exp12 Intelligence (bf_int) : moyenne de bf05, bf09, bf14, bf18
Honte (exp_hon) : moyenne de exp05, exp11
Démarche :
• Ouvrez le fichier « data.sav »
29
• Utilisez le menu Transform | Compute pour la première variable, entrez toutes les
informations nécessaires (nom, label/étiquette, formule) et appuyez sur paste (au lieu
de ok) pour transmettre la commande à la syntaxe.
• Dans la syntaxe, copiez, collez et adaptez la commande pour calculer les autres scores
d’échelles.
• Acceptez au maximum 20% de données manquantes.
L’ouverture aux émotions est constituée de 6 dimensions. Pour chacune de ces dimensions
certaines variables sont mesurées avec une échelle positive (mesure de l’ouverture) et d’autres
sont mesurées avec une échelle négative (mesure de la fermeture). Avant de pouvoir
construire nos nouveaux indicateurs d’ouverture, il faut dans d’abord faire en sorte que toutes
les variables mesures l’ouverture.
Démarche :
Ajouter au fichier de données exercice3.sav les nouvelles variables construites. Pour cela,
ouvrir exercice3.sav, ajoutez les nouveaux indicateurs qui se trouvent dans exercice4.sav.
Enregistrez le fichier fusionné sous le nom « exercice5.sav » dans le classeur « exercices » sur
votre domaine (h:\…)
30
TD4 : Analyse des données : Représentations graphiques
Fréquences
Figure 21
Joie
Cumulative
Frequency Percent Valid Percent Percent
Valid jamais ou
1 .2 .2 .2
presque jamais
parfois 25 5.2 5.2 5.4
souvent 196 40.7 40.7 46.1
presque toujours
260 53.9 53.9 100.0
ou toujours
Total 482 100.0 100.0
Figure 22
31
Graphiques pour les variables nominales et ordinales (montrant les fréquences)
Bar (bâtons):
Présentation graphique de la distribution des fréquences d'une variable dans tout l'échantillon
Graphs | Bar: Choisir Simple et Summaries for groups of cases
Figure 23
Sous « Category axes », il faut entrer la variable pour laquelle on veut obtenir les fréquences.
32
300
200
Count
100
0
Femme Homme
Sexe
Figure 24
Pour comparer la distribution des fréquences d'une variable dans les sous-groupes, passez par
Graphs | Bar, choisir « Clustered » et « Summaries for groups of cases ». Pour « Bars
represent » choisir N of cases (fréquences absolues) ou % of cases (fréquences relatives).
Dans « category axes » entrer la variable pour laquelle on veut obtenir les fréquences et dans
« Define Clusters by » la variable de groupement pour laquelle on veut obtenir des différents
bâtons.
60.0%
Sexe
Femme
Homme
50.0%
40.0%
Percent
30.0%
20.0%
10.0%
0.0%
jamais ou parfois souvent presque toujours
presque jamais ou toujours
Bonheur
Figure 25
33
Pie (Camembert)
Présentation graphique de la distribution des fréquences d'une variable dans tout l'échantillon,
on passe par Graphs | Pie: « Summaries for groups of cases », dans « Slices represent » on
peut choisir N of cases (fréquences absolues) ou % of cases (fréquences relatives). Dans
« Define Slices by » on entre la variable qui nous intéresse ici : je suis travailleur/se
travailleur (se)
pas du tout
2
3
4
tout à fait
Figure 26
Histogramme
Pour présenter la distribution des fréquences d'une variable métrique dans tout l'échantillon,
on peut faire un histogramme, pour cela, allez sous Graphs | Histogram, entrez la variable
pour laquelle vous voulez obtenir les fréquences dans « Variable », par exemple : ouv _sen.
80
60
Fréquence
40
20
Mean = 3,1378
Std. Dev. = 0,48288
N = 482
0
1,50 2,00 2,50 3,00 3,50 4,00 4,50
Ouverture aux sentiments
Figure 27
34
Modifier les caractéristiques d'un graphique
Pour pouvoir modifier un graphique, il faut commencer par double-cliquer dessus. Dans
l'éditeur des graphiques (chart editor) qui s'ouvre on peut modifier différents paramètres :
• les propriétés (p.ex. taille, couleurs, motifs) des différents éléments d'un graphique
(p.ex. titre, axes, bâtons) en double-cliquant sur l’élément (après choisir l’onglet
pertinent, p.ex. « Fill and Border » pour changer les couleurs) ;
• le texte (p.ex. d'un titre ou d’une catégorie) en grisant l'élément (cliquer une fois) et -
après une « petite pause » - en cliquant une 2e fois dessus (double-cliquer va ouvrir la
boîte-dialogue pour changer le propriétés !).
Par exemple pour changer l'échelle de l'axe des ordonnées, il faut, après avoir double-cliquer
sur le graphique, double-cliquer sur l'axe. Dans la boîte-dialogue, choisissez l’onglet
« scale ». Cliquer sur minimum ou maximum (colonne « auto ») et remplacez les valeurs
dans la colonne « custom ». En cliquant sur « major increment », on peut changer les
intervalles. Et pour transposer les axes, on peut passer par Menu Chart | Transpose Chart
Figure 28
35
Exporter des tableaux et des graphiques dans Word
La taille du graphique peut être modifiée en traînant un coin du cadre du graphique. Parfois, le
graphique n’est pas bien reproduit dans Word – dans ce cas, il faut sauvegarder le graphique
comme un fichier et l’insérer après dans Word. Dans le SPSS Viewer, cliquez droit sur le
graphique, sélectionnez « export… ». Dans la boîte-dialogue, option « export » , choisir
« charts only ». Pour « File Type » choisissez « Enhanced Metafile *.EMF ». En cliquant
sur « Browse », choisissez l’endroit où vous voulez sauvegarder le fichier et son nom. Dans
Word : menu Insertion | Image | a partir du fichier. Si le graphique est de nouveau mal
reproduit, faire la même opération, mais Pour « File Type » choisir « JPEG File *.JPG ».
Ce type de format est très universelle, cependant la définition (en points par pouce) du
graphique ne sera pas très bonne et typiquement pas acceptable pour une publication (cf.
manuel de l’APA).
• Analysez les fréquences des 4 items mesurant le névrosisme (bf4, bf10, bf12, bf19).
• Pour chaque item, créez des tableaux de fréquences. Modifiez les tableaux de sorte
que le nombre de décimales soit égal à 2.
• Pour chaque item, créez un graphique en bâtons représentant les pourcentages de
personnes.
• Créez des histogrammes pour les 6 indicateurs construits au TP3 mesurant l’ouverture.
Sauvegardez tous les résultats (« output ») sous le nom « exercice6.spo » dans votre domaine
(h:\…).
36
TD5 : Analyse des données : Mesures descriptives
Mesures descriptives
Pour obtenir des informations (en forme de tableaux ou graphiques) sur la distribution d'une
variable (fréquences, tendance (mode, médiane, moyenne), dispersion (variance, empan,
intervalle interquartile)), on utilise le menu: Analyze | Descriptive Statistics | Frequencies
Figure 29
Attention le choix des statistiques dépend de l'échelle de mesure, mais SPSS calcule tous les
coefficients pour toutes les variables choisies - même si ça n'a pas de sens!
• Charts: graphiques – on a le choix entre diagramme en bâtons (bar charts) pour les
variables nominales ou ordinales, diagramme circulaire / camembert (pie charts) pour
les variables nominales ou ordinales et histogramme (histogram) pour les variables
métriques.
37
Figure 30
• Format: Ici, on peut choisir dans quel ordre les catégories de la variable seront
affichées (order by…; default = ascending values) et la forme de présentation des
coefficients de plusieurs variables (compare variables = tous les résultats dans un
tableau, organize output by variables = tableaux séparés pour les différentes
variables).
Figure 31
Bar (bâtons)
38
Figure 32
5,00
Moyenne Ouverture aux sentiments
4,00
3,00
2,00
1,00
0,00
Femme Homme
Sexe
Figure 33
39
moyennes; MEAN(var) apparaît pour chaque variable, comme par exemple la mean pour les 6
dimensions de l’ouverture.
4,00
3,00
Moyenne
2,00
1,00
0,00
Ouverture Ouverture à Ouverture Ouverture Ouverture Ouverture
aux rêveries l-esthétique aux aux actions aux idées aux valeurs
sentiments
Figure 34
4,00
3,00
Moyenne
2,00
1,00
0,00
Femme Homme
Sexe
Figure 35
40
Remarque : la moyenne devrait être représentée par un point et non par une hauteur ou une
surface comme c’est le cas dans les graphes bar, c’est pourquoi nous vous conseillons
d’utiliser les graphes error bar (ci-après) qui sont corrects d’un point de vue strictement du
sens de la mesure de la moyenne.
Error bar
4.2
Mean +- 2 SE Ouverture aux sentiments
4.1
4.0
3.9
3.8
3.7
3.6
Femme Homme
Sexe
Figure 36
41
4.0
3.9
3.8
3.7
Mean +- 2 SE
3.6
3.5
3.4
3.3
3.2
Ouverture aux Ouverture à l- Ouverture aux Ouverture aux Ouverture aux Ouverture aux
rêveries esthétique sentiments actions idées valeurs
Figure 37
Pour obtenir un graphique de la moyenne et la variabilité de plusieurs variables métriques
dans différents sous-groupes, sélectionnez Graphs | Error Bar. Choisissez « Clustered » et
« Summaries of separate variables ». Dans Error Bars, entrer les variables pour lesquelles
vous voulez obtenir les moyennes et leur variabilité, comme par exemple pour les variables
ouverture aux sentiment et ouverture aux actions. Dans Category axes, entrez la variable de
groupement, par exemple la variable sexe.
Ouverture aux
4.2 sentiments
Ouverture aux actions
4.0
3.8
Mean +- 2 SE
3.6
3.4
3.2
3.0
Femme Homme
Sexe
Figure 38
42
Boxplot
5,00
4,50
Ouverture aux sentiments
4,00
3,50
3,00
371
2,50
2,00
Femme Homme
Sexe
Figure 39
• Boxplots pour plusieurs variables dans tout l'échantillon : cliquez sur Graphs |
Boxplot, choisissez « Simple » et « Summaries of separate variables ». Dans Boxes
represent, entrez les variables qui vous intéressent comme par exemple les 6
dimension de l’ouverture.
43
5,00 480
147
169 74
178
4,00
3,00
371
455
254 313
1
2,00 289 88 214
376 413 296 97
371
1,00
Figure 40
• Boxplots pour plusieurs variables dans différents sous-groupes : cliquez sur Graphs |
Boxplot, choisissez « Clustered » et « Summaries of separate variables ». Dans
Boxes represent, entrez les variables qui vous intéressent, par exemple les variables
ouvertures aux sentiments et ouverture aux actions. Dans Category axes, entrez la
variable de groupement, comme par exemple le sexe.
Ouverture aux
5,00 sentiments
Ouverture aux
169 actions
178
292
4,00
3,00
371
2,00 71
Femme Homme
Sexe
Figure 41
Pour modifier la présentation des résultats, passez par le menu, cliquez dans Edit | Options.
Output Labels permet de modifier la présentation des résultats. Dans la partie Pivot Table
Labeling, on peut choisir entre (1) les étiquettes des variables (labels), (2) les noms des
variables (names), (3) les noms des variables et leurs étiquettes (names and labels).
44
Sélectionner des cas
La fonction Data | Select cases permet de sélectionner des cas en fonction des valeurs d'une
variable (ou de plusieurs variables). C'est à dire qu'on peut limiter les analyses à un sous-
groupe de l'échantillon (p.ex. les femmes, un pays, etc.). Pour cela passez par Data | Select
Cases. Choisissez « If condition is satisfied », pressez le bouton « If... » et définissez la
condition à l'aide de la variable, une valeur, ainsi que des opérateurs relationnels (égal « = »,
différent de « ~= », plus petit que « < », plus grand que « > », plus petit ou égal « <= », plus
grand ou égal « >= ») et des opérateurs logiques (et « & » / « and », ou « | » / « or »), puis
pressez Continue. Pour Unselected cases are..., choisissez l'option « Filtered » ( par défaut).
Attention : l'option « deleted » supprime tous les cas non-sélectionnés!!!
Dans la vue des données, les cas non-sélectionnés sont barrés (dans la première colonne).
Dans le coin en bas à droite, SPSS nous informe que la fonction et active (« Filter on »).
SPSS ajoute une nouvelle variable nommée « filter_$ ». Les valeurs de cette variable filtre
sont 1 (Le cas remplit la condition/est sélectionné) ou 0 (Le cas ne remplit pas la condition/
n'est pas sélectionné). Une fois cette fonction en marche, seuls les cas sélectionnés (avec une
valeur de 1 sur la variable filtre) seront utilisés dans les analyses subséquentes. Si on change
la condition sous laquelle les cas sont sélectionnés, SPSS remplace la variable filter_$. Pour
garder une variable filtre, on peut renommer filter_$ (p.ex. filt_usa pour le sous-groupe de
personnes des Etats-Unis). Attention : La fonction « Select cases » reste active jusqu'à ce
qu'on la désactive!!! Pour la désactiver, il faut passer par Data | Select Cases: All cases.
La fonction Data | Split File permet de fragmenter un fichier et de comparer des cas en
fonction des valeurs d'une variable (ou de plusieurs variables). C'est à dire qu'on peut analyser
séparément des sous-groupes de l'échantillon afin de les comparer (p.ex. les femmes et les
hommes, les Etats-Unis avec la Chine, etc.). Pour cela il faut passer par les menus déroulant et
cliquer sur Data | Split File, puis choisir la variable de regroupement. L'option « compare
groups » donne un tableau commun pour les sous-groupes et l'option « Organize output by
groups » donne des tableaux séparés pour les sous-groupes.
Dans le coin en bas à droite, SPSS nous informe que la fonction et active (« Split file on »).
Attention : la fonction « Split file » reste active jusqu'à ce qu'on la désactive!!! Pour la
désactiver, il faut passer par Data | Split File, Analyze all cases, do not create groups.
45
• Créez des histogrammes pour chaque variable.
• Sauvegardez tous les résultats (« output ») sous le nom
« exercice7.spo » dans votre domaine (h:\…).
Pour le sous-groupe des allemands, analysez la distribution des « Big Five » de la personnalité
(bf_nev, bf_ext, bf_int, bf_agr et bf_con) en calculant, pour chaque variable,
• un tableau de fréquences
• la moyenne, la médiane, le mode, la variance, l’écart-type, l’intervalle interquartile,
l’asymétrie, l’aplatissement
Pour toute la population, comparez les hommes et les femmes par rapport aux
variables « Big Five » (bf_nev, bf_ext, bf_int, bf_agr et bf_con).
• Pour les deux sous-groupes, calculez les moyennes et les écart-types des 5 variables.
• Pour chaque variable « Big Five », créez des boxplots qui représentent leur dispersion
dans les deux sous-groupes, c’est-à-dire, créez des graphiques où les catégories de la
variable sexe se trouvent sur l’axe des abscisses.
Sauvegardez tous les résultats (« output ») sous le nom « exercice8.spo » dans votre domaine
(h:\…).
46
TD6 : Analyse des données : Corrélation et régression
Corrélation de rang
Pour calculer une corrélation de rang, allez sous Analyze | Correlate | Bivariate, cochez,
dans Correlation Coefficients, Spearmann et/ou Kendall’s tau-b. Les variables qui sont
entrées seront corrélées et on obtient une matrice complète, c’est à dire un tableau avec toutes
les corrélations des variables deux à deux.
Scatterplot
Le Scatterplot permet de présenter la relation entre deux variables métriques. Chaque point
dans le graphique représente un cas, c’est à dire un couple de valeurs issu de deux variables.
Pour obtenir un scatterplot, passez par Graphs | Scatter: « Simple ». Pour cela :
• Choisir les variables : Y-Axis pour l'axe des ordonnées et X-Axis pour l'axe des abcisses
• Set markers by : on peut entrer une variable de groupement (p.ex. le sexe) – les
différents sous-groupes seront affichés par des couleurs différentes. Attention : un point
dans le Scatterplot peut représenter plusieurs cas – la couleur affichée correspond au
sous-groupe du premier cas! L'utilisation de cette option n'est pas recommandée!
• Label cases by : on peut entrer la variable ID (numérotation des cas) pour obtenir le
numéro d'un cas individuel dans l'éditeur de graphique – quand on n'entre pas de variable
ici, SPSS prend la numérotation des lignes (qui ne correspond pas forcément à la variable
ID!)
• Options: Après avoir entré une
variable ID dans « label cases by »,
on peut cocher l'option « Display
chart with case labels » (en cliquant
sur « Options »). Ainsi, tous les
points seront marqués par leurs
numéros, le désavantage, c’est que ce
n’est pas très lisible.
47
• Cliquez sur le point dont on veut obtenir le numéro
• Cliquez encore une fois au-dessus pour effacer le numéro
• Pour que le nombre de cas représentés soit indiqué par la taille des points ou par
l’intensité de leur couleur, double-cliquez sur les points de données, puis choisissez
l’onglet « Point bins » et cliquez sur « Bins » (défaut : « marker size »)
• Pour obtenir la droite de régression, sélectionnez les points de données, après cliquez
sur Chart | Add chart element: « Fit line at total »
Corrélation de Bravais-Pearson
Pour calculer une corrélation pour des variables numériques, allez sous Analyze | Correlate |
Bivariate, le coefficient de corrélation de Pearson est le coefficient par défaut. Les variables
qui sont entrées seront corrélées et on obtient une matrice complète. Pour obtenir la moyenne
et l'écart-type pour chaque variable (« means and standard deviations ») ainsi que les
produits croisés et les covariances (« cross-product deviations and covariances ») allez sous
Options. Sous Options, vous trouverez également les « missing values », cette fonction est
importante uniquement si on analyse plusieurs variables en même temps. Si on choisis
« Exclude cases pairwise » pour chaque coefficient de corrélation, les cas qui n'ont pas de
valeurs valables sur le couple de variables seront exclus. Dans le cas où on choisist « Exclude
cases listwise » alors pour chaque coefficient de corrélation, seulement les cas qui ont des
valeurs valables sur toutes les variables seront analysés (même N pour chaque coefficient).
Passer par la syntaxe : parfois, on veut obtenir des corrélations entre deux groupes de
variables (p.ex., les « Big Five » et les différentes variables de l'expressivité émotionnelle).
Dans ce cas, le tableau standard (obtenu par le menu Correlate) devient très grand et il y aura
des corrélations dont on n'a pas besoin (p.ex. entre les variables « Big Five »). Pour obtenir
seulement les corrélations entre les deux groupes, il faut utiliser la syntaxe :
• Dans la boîte-dialogue, entrer toutes les variables et cliquer sur Paste (au lieu de OK)
• Dans la fenêtre de syntaxe, il faut ajouter le mot WITH entre les deux groupes de
variables. Exemple:
CORRELATIONS
/VARIABLES=bf_ext bf_agr bf_con bf_nev bf_int WITH exp_amo
exp_joi exp_peu exp_col exp_tri
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE .
48
Correlations
bf_nev Big Five: Pearson Correlation -.042 -.055 .141** .162** .241**
Nevrocisme Sig. (2-tailed) .352 .232 .002 .000 .000
N 481 481 481 478 480
bf_int Big Five: Pearson Correlation .145** .094* .036 .088 .086
Intelligence Sig. (2-tailed) .001 .040 .435 .055 .059
N 481 481 481 478 480
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
Pour effectuer une régression linéaire simple, allez sous Analyze | Regression | Linear :
• « Dependent » : Entrez la variable Y (variable expliquée), par exemple l’ouverture
aux sentiments.
• « Independent » : Entrez la variable X (variable explicative), par exemple
l’extraversion.
• Statistics: on peut cocher descriptives pour obtenir des statistiques descriptives pour
les variables (moyenne, écart-type, taille de l'échantillon, corrélation des variables)
• Pour la régression simple (avec une variable explicative X), il ne faut pas d'autres
options!
Syntaxe :
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT ouv_sen
/METHOD=ENTER bf_ext .
SPSS-Viewer (Résultat)
« Model summary » :
• R : correspond à la corrélation rxy dans le cas de la régression simple
• R2 : coefficient de détermination ou pourcentage de la variation de Y expliquée par la
régression
49
Récapitulatif du modèle
Erreur
standard de
Modèle R R-deux R-deux ajusté l'estimation
1 ,325a ,106 ,104 ,45768
a. Valeurs prédites : (constantes), bf_ext Big Five:
Extraversion
ANOVAb
Somme
Modèle des carrés ddl Carré moyen F Signification
1 Régression 11,881 1 11,881 56,720 ,000a
Résidu 100,339 479 ,209
Total 112,220 480
a. Valeurs prédites : (constantes), bf_ext Big Five: Extraversion
b. Variable dépendante : ouv_sen Ouverture aux sentiments
Tableau « Coefficients »
Coefficientsa
50
TP6 : Analyse des données : Corrélation et régression
Exercice 9 corrélation de rang
Sauvegardez tous les résultats (« output ») sous le nom « exercice9.spo » dans votre domaine
(h:\…).
Recoder la variable âge en quatre groupes contenant chacun 25% de la population. Puis pour
chaque groupe d’âge séparément, analysez la relation entre la fréquence expression de la peur
et la fréquence d’expression de la colère :
Sauvegardez tous les résultats (« output ») sous le nom « exercice10.spo » dans votre domaine
(h:\…).
51
52
SECTION DE PSYCHOLOGIE
UNI MAIL - 40 bd du Pont-d’Arve | CH-1205 Genève
QUESTIONNAIRE
Ci-après, vous trouverez une liste d’émotions. Svp, indiquez pour chaque
émotion à quelle fréquence vous exprimez cette émotion à d’autres
personnes quand vous la ressentez.
jamais presque
ou par- sou- toujours
presque fois vent ou
jamais toujours
1 Affection 1 2 3 4
2 Joie 1 2 3 4
3 Peur 1 2 3 4
4 Colère 1 2 3 4
5 Honte 1 2 3 4
6 Tristesse 1 2 3 4
7 Amour 1 2 3 4
8 Bonheur 1 2 3 4
9 Inquiétude 1 2 3 4
10 Irritation 1 2 3 4
11 Culpabilité 1 2 3 4
12 Depression 1 2 3 4
jamais presque
ou par- sou- toujours
presque fois vent ou
jamais toujours
53
Ci-après, vous trouverez une liste de traits de caractère. Pour chaque mot, veuillez indiquer
la réponse qui vous semble le mieux décrire votre personnalité, svp.
Je suis…
Je suis…
pas du tout pas du tout
tout à fait tout à fait
1 2 3 4 5 1 2 3 4 5
amical(e) ¡ ¡ ¡ ¡ ¡ consciencieux ¡ ¡ ¡ ¡ ¡
(se)
chaleureux(se) ¡ ¡ ¡ ¡ ¡ lunatique ¡ ¡ ¡ ¡ ¡
susceptible ¡ ¡ ¡ ¡ ¡ cultivé(e) ¡ ¡ ¡ ¡ ¡
sociable ¡ ¡ ¡ ¡ ¡ plein(e) de ¡ ¡ ¡ ¡ ¡
tempérament
assidu(e) ¡ ¡ ¡ ¡ ¡ serviable ¡ ¡ ¡ ¡ ¡
sensible ¡ ¡ ¡ ¡ ¡ ambitieux(se) ¡ ¡ ¡ ¡ ¡
pas du tout pas du tout
tout à fait tout à fait
54
Les questions qui suivent portent sur un aspect de votre personnalité. Pour chaque
question, veuillez indiquer la réponse qui vous semble la plus appropriée. Evaluez
les affirmations en utilisant l’échelle d’approbation.
pas du un peu moyenne- plutôt tout à fait
tout d’accord ment d’accord d’accord
d’accord d’accord
55
21 Je crois que la fidélité à ses propres idéaux et principes est plus
1 2 3 4 5
importante que « l’ouverture d’esprit ».
22 Si je sens que mon esprit commence à dériver vers des rêveries,
j’ai l’habitude de m’occuper et de me mettre à me concentrer sur 1 2 3 4 5
un travail ou une activité.
23 Certains genres de musique exercent sur moi une fascination sans
1 2 3 4 5
fin.
24 Je remarque rarement les changements d’humeurs ou les
1 2 3 4 5
sentiments que provoquent des environnements différents.
q Sport
q Rencontrer des amis
q Activités culturelles (cinéma, expositions, concerts, etc.)
q Animal domestique
q Instrument de musique
q Télévision
q Internet
q Bricolage (tricot, jardinage, etc.)
q Autre : _____________________________________________________
56
Qu’est ce que ces loisirs vous apportent ?
Variables socio-démographiques :
Votre code:
Première lettre du prénom de votre mère:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
57