Chapitre 1
Chapitre 1
Chapitre 1
ccc
P. 2 / 36 Plan
1 Vocabilaires
7 Représentation graphique
8 Représentation graphique
9 Représentation graphique
10 Représentation graphique
Définition
On appelle statistique descriptive l’ensemble des méthodes et techniques
mathématiques permettant de présenter, décrire et résumer un ensemble
de données.
Définition
Une population statistique est l’ensemble sur lequel on effectue des
observations. Les éléments de cette ensemble sont appelées des individus.
Définition
Un échantillon est un sous ensemble de la population. Il doit être
représentatif de la poupulation :
Pour extendre les résultats obtenus sur l’échantillon à la population
L’intérêt porte sur la population et non pas su l’échantillon
Définition
Une variable statistique (appelée aussi caractères) est ce qui est observée
ou mesurée sur les individus.
Une variable statistique peut être
Quantitative : ses valeurs sont des nombres exprimant une quantité,
sur lesquels on peut effectuer les opérations arithmétiques. Cette
variable peut être
I discrète : ses valeurs sont isolées
I continue : ses valeurs sont regroupées par classe (intervalle de R)
Qualitative : ses valeurs sont des modalités (ou catégories)
exprimées sous forme latérale ou par codage numérique.
I ordinales : on peut ordonner les modalités de cette variable
I nominales : on ne peut pas ordonner ses valeurs.
Exemple 3.
La série statistique suivante représente les notes obtenues par 30 élèves,
0 à moins de 1 2
1 à moins de 2 3
2 à moins de 3 5
3 à moins de 4 6
4 à moins de 5 4
5 à moins de 6 3
6 à moins de 7 1
7 à moins de 8 3
8 à moins de 9 2
9 à moins de 10 1
Fréquence cumulées de xi :
i
X
Fi = fj
j=1
n/2 − Nj−1
Me = dj + aj
nj
Limites
La médiane est plus robuste que la moyenne (pas influencée par les
valeurs extrêmes) mais elle est influencée par le nombre d’observations.
Remarque La médiane correspond à la valeur telle que la fréquence
cumulée est égale à 1/2
x1 ≤ x2 ≤ . . . ≤ xn
faire la division euclidienne de n par 4. On calcul Q1 , Q2 Q3 selon les 4
cas :
Cas n = 4p :
xp + xp+1 x2p + x2p+1 x3p + x3p+1
Q1 = Q2 = Me = Q3 =
2 2 2
Cas n = 4p + 1 :
xp + xp+1 x3p+1 + x3p+2
Q1 = Q2 = Me = x2p+1 Q3 =
2 2
Cas n = 4p + 2 :
x2p+1 + x2p+2
Q1 = xp+1 Q2 = Me = Q3 = x3p+2
2
Cas n = 4p + 2 :
Q1 = xp+1 Q2 = Me = x2p+2 Q3 = x3p+3
ccc Statistique descriptive : cas univarié
P. 18 / 36 Indicateurs de position d’une variable quantitative
les quartiles
Calcul des quartiles, cas continu
Soit une série statistique de taille n, classée suivant la partition
[d1 , d2 [, [d2 , d3 [, . . . , [dk , dk+1 [, . . . , [dn−1 , dn [. On note respectivement
nk , Nk et ak l’effectif, l’effectif cumulé et l’amplitude de la classe
[dk , dk+1 [
Calcul Q1
Repérer la première classe contenant au moins 25% des effectifs
cumulés. Supposons que c’est [dj , dj+1 [
Calculer Q1
n/4 − Nj−1
Q1 = dj + aj
nj
Calcul Q3
Repérer la première classe contenant au moins 75% des effectifs
cumulés. Supposons que c’est [dj , dj+1 [
Calculer Q3
3n/4 − Nj−1
Q3 = dj + aj
nj
ccc Statistique descriptive : cas univarié
P. 19 / 36 Indicateurs de position d’une variable quantitative
le mode
Exemples
La variance est la somme pondérée des carrés des écarts des valeurs de la
série à la moyenne. Soit la série statistique des valeurs x1 , x2 , . . . , xn . La
variance de la série est
n
1X
sx2 = (xi − x̄)2
n
i=1
sx2 ≥ 0 sx ≥ 0
Theorème de Koeing
n−1 2
sx2 = s̄
n x
Un écart-type est faible entraı̂ne Une série peu dispersée (les valeurs
de la série sont regroupées autour de la valeur moyenne)
Par définition
A partir de la table des fréquences (des effectifs).
I Cas discret, si k valeurs sont distinctes, ni (resp fi ) désigne l’effectif
(resp la fréquence) de la valeurs xi
k k
1X X
sx2 = ni (xi − x̄)2 (resp sx2 = fi (xi − x̄)2 )
n i=1 i=1
Me = x̄
Une distribution est plus ou moins aplatie selon que les fréquences des
valeurs voisines des valeurs centrales diffèrent peu ou beaucoup les une
par rapport aux autres.
Coefficient de Fisher :
n
1 X
a= (xi − x̄)4
sx4 n
i=1
Exemple
4.5
4.0
3.5
3.0
2.5
2.0
1.5
1 2
ccc Statistique descriptive : cas univarié