MTH160

MTH160
Calcul de probabilités et statistique

Support de cours et exercices de travaux dirigés
O
LD
A
ER
Issa Cherif GERALDO

Département de Mathématiques, Faculté des Sciences, Université de Lomé
.G
C
I.
Mars 2023
2 MTH160 : Cours et exercices (I. C. GERALDO)
TABLE DES MATIÈRES
I Calcul de probabilités 7
1 Ensembles finis et Analyse combinatoire 9

1.1 Ensembles finis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.2 Opérations sur les ensembles finis et calcul de cardinaux . . . . . . . . 10
O
1.2 Formules classiques d’analyse combinatoire . . . . . . . . . . . . . . . . . . . . 14
1.2.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
LD
1.2.2 Principe multiplicatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2.3 Principe d’addition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2.4 Arrangements avec répétition . . . . . . . . . . . . . . . . . . . . . . . . 15
A
1.2.5 Arrangements sans répétition - Permutations . . . . . . . . . . . . . . . 16

ER
1.2.6 Combinaisons sans répétition . . . . . . . . . . . . . . . . . . . . . . . . 16

1.2.7 Combinaisons avec répétition . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
.G
2 Phénomènes aléatoires et modèle probabiliste 21

C
2.1 Notion d’expérience aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.2 Evénements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
I.
2.2.1 Notion d’événement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.2.2 Langage des événements . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3 Espaces probabilisés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3.1 Définition de la probabilité . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3.2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.4 Notion d’équiprobabilité ou de probabilité uniforme . . . . . . . . . . . . . . . 26
2.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3 Probabilité conditionnelle et indépendance 31

3.1 Introduction et définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Notion d’indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.1 Indépendance de deux événements . . . . . . . . . . . . . . . . . . . . 32
3.2.2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.3 Incompatibilité et indépendance . . . . . . . . . . . . . . . . . . . . . . 33
3.2.4 Indépendance mutuelle . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3
3.3 Formules importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.3.1 Théorème des probabilités totales . . . . . . . . . . . . . . . . . . . . . 34
3.3.2 Formule de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4 Généralités sur les variables aléatoires 39

4.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2 Variables aléatoires discrètes et continues . . . . . . . . . . . . . . . . . . . . . 40
4.2.1 Variables aléatoires discrètes . . . . . . . . . . . . . . . . . . . . . . . . 40
4.2.2 Variables aléatoires continues . . . . . . . . . . . . . . . . . . . . . . . . 42
4.3 Moments d’une variable aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.3.1 Espérance mathématique . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.3.2 Variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5 Lois discrètes et continues usuelles 49

5.1 Lois discrètes usuelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5.1.1 Loi uniforme discrète . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5.1.2 Loi de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.1.3 Loi binomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.1.4 Loi géométrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.1.5 Loi de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.1.6 Loi hypergéométrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.2 Lois continues usuelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.2.1 Loi uniforme continue U [ a, b] . . . . . . . . . . . . . . . . . . . . . . . . 53
5.2.2 Loi exponentielle E (λ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5.2.3 Loi normale N (m, σ ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.3 Approximations usuelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.3.1 Approximation binomiale de la loi hypergéométrique . . . . . . . . . . 59
5.3.2 Approximation de la loi binomiale par une loi de Poisson . . . . . . . 59
5.3.3 Approximation de la loi binomiale par une loi normale . . . . . . . . . 60
5.3.4 Approximation de la loi de Poisson par une loi normale . . . . . . . . 60
5.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
II Statistique descriptive 65
6 Concepts fondamentaux de la statistique 67

6.1 Définition et champs d’application de la statistique . . . . . . . . . . . . . . . 67
6.2 Vocabulaire de la statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
6.2.1 Population, individus et échantillon . . . . . . . . . . . . . . . . . . . . 67
6.2.2 Caractères ou variables statistiques . . . . . . . . . . . . . . . . . . . . 69
6.2.3 Série statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
6.3 Statistique descriptive et statistique inférentielle . . . . . . . . . . . . . . . . . 72
Table des matières 5
7 Séries statistiques à une variable 73

7.1 Description d’une série statistique à une variable . . . . . . . . . . . . . . . . . 73
7.1.1 Description d’une série quantitative . . . . . . . . . . . . . . . . . . . . 73
7.1.2 Description d’une série qualitative . . . . . . . . . . . . . . . . . . . . . 76
7.2 Représentations graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
7.2.1 Variables quantitatives discrètes : diagramme en bâtons et polygone
des effectifs/fréquences . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
7.2.2 Variables quantitatives continues . . . . . . . . . . . . . . . . . . . . . . 77
7.2.3 Variables qualitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
7.3 Caractéristiques numériques d’une distribution . . . . . . . . . . . . . . . . . 81
7.3.1 Les caractéristiques de position . . . . . . . . . . . . . . . . . . . . . . . 82
7.3.2 Les caractéristiques de dispersion . . . . . . . . . . . . . . . . . . . . . 87
7.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
8 Séries statistiques à deux variables 93

8.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
8.2 Caractéristiques numériques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
O
8.2.1 Cas des données non groupées . . . . . . . . . . . . . . . . . . . . .
LD . . 95
8.2.2 Cas des tableaux de contingence (données groupées) . . . . . . . . . . 96
8.3 Représentation graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
8.4 Ajustement linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
A
8.4.1 Notion d’ajustement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

8.4.2 Méthode des moindres carrés ordinaires (MCO) . . . . . . . . . . . . . 99
ER
8.4.3 Qualité de l’ajustement par MCO . . . . . . . . . . . . . . . . . . . . . . 101

8.5 Exemples d’application de l’ajustement linéaire à l’ajustement non linéaire . . 103
.G
8.5.1 Ajustement par une fonction puissance . . . . . . . . . . . . . . . . . . 103

8.5.2 Ajustement par une fonction exponentielle . . . . . . . . . . . . . . . . 103
8.5.3 Ajustement par une fonction logistique . . . . . . . . . . . . . . . . . . 103
C
8.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

I.
III Annexe 107
A Table de la f.r. et des quantiles de la loi N (0, 1) 109
B Annexe pour les exercices du chapitre 8 111
Références bibliographiques 113

Première partie
O
Calcul de probabilités
LD
A
ER
.G
C
I.
7
C HAPITRE 1
E NSEMBLES FINIS ET A NALYSE COMBINATOIRE
Résumé – Ce chapitre rappelle quelques propriétés des ensembles finis ainsi que les for-
mules classiques d’analyse combinatoire généralement présentées en classe de Terminale et
qui seront très utiles dans la suite du cours. L’objectif est de savoir résoudre les problèmes
classiques d’analyse combinatoire en utilisant la formule adaptée.
Sommaire
O
1.1 Ensembles finis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
LD
1.1.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.2 Opérations sur les ensembles finis et calcul de cardinaux . . . . . . 10
1.2 Formules classiques d’analyse combinatoire . . . . . . . . . . . . . . . . . 14
A
1.2.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2.2 Principe multiplicatif . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
ER
1.2.3 Principe d’addition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.2.4 Arrangements avec répétition . . . . . . . . . . . . . . . . . . . . . . 15
.G
1.2.5 Arrangements sans répétition - Permutations . . . . . . . . . . . . . 16

1.2.6 Combinaisons sans répétition . . . . . . . . . . . . . . . . . . . . . . 16
1.2.7 Combinaisons avec répétition . . . . . . . . . . . . . . . . . . . . . . 18
C
1.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
I.
1.1 E NSEMBLES FINIS

1.1.1 Généralités
Définition 1.1
• Un ensemble Ω est une collection d’objets appelés éléments de l’ensemble. On écrit
x ∈ Ω si x est élément de Ω et x ̸∈ Ω sinon.
• On admet l’existence de l’ensemble vide noté ∅ et qui ne contient aucun élément.
On représente souvent les ensembles par des diagrammes dits de Venn 1 ou d’Euler-
Venn 2 (voir Figure 1.1).
1. John Venn (1834-1923), mathématicien et logicien britannique
2. Leonhard Euler (1707-1783), mathématicien et physicien suisse
9
A B
F IGURE 1.1 – Exemple de représentation de deux ensembles A et B à l’aide des diagrammes de Venn
Définition 1.2
• On dit qu’une ensemble Ω est fini s’il est vide ou s’il peut être mis en relation avec un
ensemble de numéros de la forme {1, . . . , n} (n ∈ N∗ ) de sorte qu’à chaque élément
de E corresponde un unique numéro et qu’à chaque numéro corresponde un unique
élément de Ω.
• Dans ce cas, le nombre n est appelé le cardinal de Ω noté Card(Ω) avec la convention
Card(∅) = 0.
• Un ensemble non fini est dit infini.
Exemple 1.3 L’ensemble des lettres minuscules Ω = { a, b, c, d} est fini de cardinal 4 alors
que l’ensemble N des entiers naturels et l’ensemble R des nombres réels sont des ensembles
infinis.
Définition 1.4 Soit Ω un ensemble. Un ensemble A est un sous-ensemble (ou une partie) de
Ω si tout élément de A est nécessairement élément de Ω. On note A ⊂ Ω. L’ensemble des
parties de Ω est noté P (Ω). En d’autres termes,
A ∈ P (Ω) si et seulement si A ⊂ Ω.
Par convention, l’ensemble vide ∅ est inclus dans tous les ensembles.
n o
Exemple 1.5 Si Ω = { a, b} alors P (Ω) = ∅, { a}, {b}, { a, b} .
1.1.2 Opérations sur les ensembles finis et calcul de cardinaux
Définition 1.6 Soient Ω un ensemble et A, B deux parties de Ω.

1) L’intersection de A et B, notée A ∩ B, est l’ensemble des éléments appartenant à A et à B.
2) Les ensembles A et B sont dits disjoints s’ils n’ont aucun élément en commun c’est-à-dire
si A ∩ B = ∅.
3) La réunion (ou l’union) de A et B, notée A ∪ B, est l’ensemble des éléments appartenant
à A ou à B ou en d’autres termes, l’ensemble des éléments appartenant à l’un au moins
des deux ensembles.
Chapitre 1. Ensembles finis et Analyse combinatoire 11
4) Le complémentaire de A dans Ω, noté A, est l’ensemble des éléments de Ω n’appartenant

pas à A.
5) La différence de A et B, notée A \ B, est l’ensemble des éléments appartenant à A et n’ap-
partenant pas à B.
A \ B = A ∩ B.
6) La différence symétrique de A et B, notée A∆B, est l’ensemble des éléments appartenant à

une et une seule des deux parties A et B (c’est-à-dire que A∆B contient les éléments de
A n’appartenant pas à B et les éléments de B n’appartenant pas à A).
A∆B = ( A ∪ B) \ ( A ∩ B) = ( A ∩ B) ∪ ( B ∩ A).
Illustrons les différentes définitions à l’aide d’un diagramme d’Euler-Venn.
O
A A∩B LD B
A
F IGURE 1.2 – Représentation de A ∩ B pour deux ensembles A et B

ER
.G
A B
C
A ∪ B (en gris)
I.
F IGURE 1.3 – Représentation de A ∪ B pour deux ensembles A et B
E A A
F IGURE 1.4 – Représentation du complémentaire
Remarque 1.7 On peut étendre les notions d’intersection et de réunion à une famille consti-
tuée de plus de deux ensembles. Soient A1 , A2 , . . . , An des ensembles.
A A\B B
F IGURE 1.5 – Représentation de la différence de deux ensembles
A A\B B\A B
F IGURE 1.6 – Représentation de la différence symétrique de deux ensembles
n
[
1) La réunion de A1 , A2 , . . . , An notée A1 ∪ A2 ∪ · · · ∪ An ou encore Ai est l’ensemble
i =1
des éléments appartenant à l’un au moins des Ai .
n
\
2) L’intersection de A1 , A2 , . . . , An notée A1 ∩ A2 ∩ · · · ∩ An ou encore Ai est l’ensemble
i =1
des éléments appartenant à tous les Ai .
Le théorème suivant donne une propriété très utile dans la manipulation des ensembles.
Théorème 1.8 (Lois de De Morgan 3 ) Soient Ω un ensemble et A, B deux parties de Ω. Alors :
A∪B = A∩B et A ∩ B = A ∪ B. (1.1)
Donnons à présent quelques règles de calcul des cardinaux d’ensembles obtenus suite à
des opérations sur des ensembles finis de cardinaux connus.
Théorème 1.9 Soit Ω un ensemble fini et soient A et B des parties de Ω.

1) Si A et B sont disjoints, Card( A ∪ B) = Card( A) + Card( B).
2) Pour A et B quelconques,
Card( A ∪ B) = Card( A) + Card( B) − Card( A ∩ B).
3) Card( A) = Card(Ω) − Card( A).

4) Card( A \ B) = Card( A) − Card( A ∩ B).
5) Card( A∆B) = Card( A \ B) + Card( B \ A).
Application 1.10 Dans une population comptant 1 000 individus, 650 personnes parlent
(couramment) le français, 250 parlent l’anglais et 100 personnes parlent les deux langues.
Soit Ω l’ensemble des individus de la population. On désigne par A et F respectivement les
ensembles d’individus parlant l’anglais et le français. Traduire les hypothèses de l’énoncé
et déterminer le nombre d’individus :
1) parlant au moins l’une des deux langues ;
2) ne parlant pas l’anglais ;
3) ne parlant aucune des deux langues (i.e. ni le français ni l’anglais) ;
4) parlant le français mais pas l’anglais ;
5) parlant une seule des deux langues.
Définition 1.11 Soient A et B deux ensembles. On appelle produit cartésien de deux en-
sembles A et B, noté A × B, l’ensemble des couples ( a, b) tels que a ∈ A et b ∈ B c’est-à-dire
O
A × B = {( a, b) | a ∈ A et b ∈ B}.
Lorsque A = B, le produit cartésien A × B est noté A2 .

LD
Exemple 1.12 Considérons le lancer de deux dés différents dont les faces sont numérotées
A
de 1 à 6. Le résultat d’un lancer est de la forme ( x1 , x2 ) où x1 (resp. x2 ) représente le chiffre

ER
obtenu sur la face supérieure du premier (resp. second) dé. Comme x1 ∈ {1, . . . , 6} et x2 ∈
{1, . . . , 6}, l’ensemble des résultats est donc le produit cartésien {1, . . . , 6}2 .
.G
On peut généraliser le produit à cartésien à un nombre fini quelconque d’ensembles.
Définition 1.13 Soient n ∈ N∗ et E1 , . . ., En des ensembles. Pour tous x1 ∈ E1 , . . ., xn ∈

C
En , l’élément ( x1 , . . . , xn ) est un n−uplet et on note E1 × · · · × En l’ensemble de tous ces

n−uplets c’est-à-dire
I.
E1 × · · · × En = {( x1 , . . . , xn ) | x1 ∈ E1 et . . . et xn ∈ En }.
Exemple 1.14 Considérons les numéros de téléphone formés de 8 chiffres dont chaque
chiffre peut prendre les valeurs entières de 0 à 9. Un numéro de téléphone peut être consi-
déré comme un 8−uplet ( x1 , x2 , . . . , x8 ) où xi (i = 1, . . . , 8) représente le ième chiffre du
numéro. L’ensemble des numéros est le produit cartésien {0, 1, 2, . . . , 9}8 .
Théorème 1.15 Soient n un entier naturel non nul et E1 , . . ., En des ensembles finis. Alors,
Card( E1 × E2 × · · · × En ) = Card( E1 ) × Card( E2 ) × · · · × Card( En ). (1.2)
Application 1.16 Combien y a-t-il de numéros de téléphone formés de 8 chiffres dont chaque
chiffre peut prendre les valeurs entières de 0 à 9 ?
1.2 F ORMULES CLASSIQUES D ’ ANALYSE COMBINATOIRE
1.2.1 Généralités
L’analyse combinatoire est une branche des mathématiques qui étudie comment comp-
ter les dispositions que l’on peut former à l’aide des éléments d’un ensemble fini. Une dispo-
sition est un ensemble d’éléments pris parmi les éléments étudiés. Deux critères importants
sont utilisés pour distinguer les dispositions : l’ordre et la répétition.
Définition 1.17
1) Une disposition est dite ordonnée lorsque l’ordre des éléments qui la composent est im-
portant. Elle est dite non-ordonnée sinon. Une disposition ordonnée contenant n éléments
est encore appelée n−uplet.
2) Une disposition est dite sans répétition lorsqu’un élément y apparaît au plus une fois. Elle
est dite avec (possibilité de) répétition sinon.
3) Une disposition non-ordonnée est appelée une combinaison et une disposition ordonnée
est appelée un arrangement.
Exemple 1.18
1) Dispositions ordonnées (arrangements) avec répétition : caractères d’une plaque miné-
ralogique, un numéro de téléphone, un mot de passe, un code, les numéros issus d’un
tirage de loterie, . . .
2) Dispositions ordonnées (arrangements) sans répétition : le classement d’une compéti-
tion, les membres composant un comité (les postes étant deux à distincts et le cumul de
postes étant interdit), . . .
3) Dispositions non-ordonnées (combinaisons) sans répétition : la liste des équipes quali-
fiées pour la phase finale de la coupe du monde, la liste des étudiants assidus au cours,
...
4) Dispositions non-ordonnées (combinaisons) avec répétition : distribution d’objets à des
personnes (chacun pouvant se servir plusieurs fois), . . .
Remarque 1.19 Dans la suite du cours, les dispositions ordonnées seront notées avec des
parenthèses et celles non-ordonnées sans répétition seront notées avec des accolades. Les
dispositions non ordonnées avec répétition seront notées avec des crochets et ne doivent
pas être confondues avec les intervalles. Par exemple, soit Ω = { a, b, c, d}. Alors
(a) (d, a, b, c, a, b, a, d) est une disposition ordonnée de 8 éléments avec répétition ;
(b) [ a, a, b, c, a, b, a, d] est une disposition non-ordonnée de 8 éléments avec répétition ;
(c) (d, a, b) est une disposition ordonnée de 3 éléments sans répétition ;
(d) { a, b} est une disposition non-ordonnée de 2 éléments sans répétition.
1.2.2 Principe multiplicatif

Il permet de compter le nombre de résultats d’une expérience pouvant se décomposer
en k étapes successives (k ∈ N∗ ), la i −ème étape ayant ni choix possibles (i = 1, . . . , k).
Pour la première étape, il y a n1 choix possibles, et pour chaque choix de l’étape 1, il y a
n2 choix possibles pour l’étape 2, et ainsi de suite. Le nombre total de résultats possibles de
l’expérience globale est donc
k
n= ∏ n i = n1 × n2 × · · · × n k .
i =1
Application 1.20 Une assemblée élit son bureau composé d’un président, d’un trésorier et
d’un secrétaire. Le cumul de poste étant interdit, combien de bureaux peut-on former :
1) avec huit candidats (en supposant que chaque candidat est éligible à tous les postes) ?
2) sachant qu’il y a deux candidats pour le poste de président, trois pour le poste de tréso-
rier et trois pour le poste de secrétaire ?
O
1.2.3 Principe d’addition
LD
Il permet de compter le nombre de dispositions lorsque l’on raisonne par cas.
Proposition 1.21 (Principe d’addition) Soient n un entier naturel tel que n ⩾ 2 et A1 , A2 , . . .,
A
An des ensembles finis deux à deux disjoints c’est-à-dire que pour tous i, j ∈ {1, . . . , n}, on a
ER
Ai ∩ A j = ∅ dès que i ̸= j. Alors, on a l’égalité

Card( A1 ∪ A2 ∪ · · · An ) = Card( A1 ) + Card( A2 ) + · · · + Card( An )
G
que l’on peut réécrire plus simplement

!
C.
n
[ n
Card Ai = ∑ Card( Ai ).
i =1 i =1
I.
Application 1.22 Soit Ω = { A, B, C, D, E}. Combien de mots de 3 lettres constitués unique-

ment de consonnes ou uniquement de voyelles peut-on former avec les lettres de Ω ?
1.2.4 Arrangements avec répétition

Proposition 1.23 Soit Ω un ensemble de cardinal n et soit p ∈ N. Le nombre d’arrangements avec
répétition de p éléments parmi n est
n × n × · · · × n = np.
| {z }
p fois
Application 1.24 Soit Ω = {1, 2, 3, 4, 5}. Combien de nombres de trois chiffres peut-on for-
mer avec les éléments de Ω ?
1.2.5 Arrangements sans répétition - Permutations

Proposition 1.25 Le nombre d’arrangements sans répétition de p éléments parmi n (p ⩽ n) est
p
A n = n × ( n − 1) × · · · × ( n − p + 1) . (1.3)
| {z }
p facteurs
Application 1.26 Une compétition réunit 16 équipes. Un podium est un triplet ( x1 , x2 , x3 )

avec x1 , x2 et x3 désignant respectivement le vainqueur, le finaliste malheureux et l’équipe
classée troisième. Combien y a-t-il de podiums possibles ?
Définition 1.27 (Permutation) Lorsque p = n, un arrangement de p éléments parmi n est

appelé une permutation. Une permutation de n éléments distincts est donc un réarrangement
ordonné, sans répétition de ces n éléments.
Exemple 1.28 Les permutations possibles de trois éléments A, B et C sont ABC, ACB, BAC,
BCA, CAB et CBA.
Proposition 1.29 Soit n ∈ N∗ . Le nombre de permutations possibles de n éléments distincts vaut :
Ann = n × (n − 1) × · · · × 1
| {z }
n facteurs
et est noté n! (lire « factorielle n »). Par convention, 0! = 1.
Application 1.30 De combien de façons peut-on faire asseoir 5 personnes dans une rangée
de 5 chaises ?
1.2.6 Combinaisons sans répétition

1.2.6.1 Définition et exemple
Proposition 1.31 Soit Ω un ensemble de cardinal n et soit p un entier naturel non nul tel que
p ⩽ n. Le nombre de combinaisons sans répétition de p éléments parmi n (ou le nombre de parties
de Ω contenant p éléments) est
p n!
Cn = .
p!(n − p)!
Exemple 1.32 Soit Ω = { a, b, c, d} un ensemble à 4 éléments. Le nombre de parties de Ω

contenant 2 éléments est aussi le nombre de combinaisons sans répétition de 2 éléments
parmi 4. Il vaut
4!
C42 = = 6.
2!2!
Si on essaie de compter les parties de E ayant 2 éléments, on obtient :
{ a, b}, { a, c}, { a, d}, {b, c}, {b, d} et {c, d}.
Elles sont bien au nombre de 6.
Application 1.33 On demande de pronostiquer les deux finalistes de la CM. Combien y

a-t-il de possibilités ?
1.2.6.2 Propriétés
Proposition 1.34 Soient n et p deux entiers naturels tels que p ⩽ n. On a :

p n− p
(1) Cn0 = 1, (2) Cn1 = n, (3) Cnn = 1, (4) Cn = Cn .
Théorème 1.35 (Formule du binôme de Newton) Soient n ∈ N et x, y ∈ R. On a :
O
n n
LD
( x + y)n = ∑ Cnk xk yn−k = ∑ Cnk xn−k yk . (1.4)
k =0 k =0
A
1.2.6.3 Cardinal de l’ensemble des parties

ER
Proposition 1.36 Soit Ω un ensemble fini tel que Card(Ω) = n. Le nombre total de parties de Ω
est :
Card(P (Ω)) = 2n .
.G
Preuve : Le nombre total de parties de Ω est le nombre de parties à 0 élément + le nombre

C
de parties à 1 élément + le nombre de parties à 2 éléments + · · · + le nombre de parties à n

éléments. Ainsi :
I.
n n
Card(P (Ω)) = Cn0 + Cn1 + · · · + Cnn = ∑ Cnk = ∑ Cnk (1)k (1)n−k
k =0 k =0
n
= (1 + 1) d’après la formule du binôme de Newton
n
=2 .
Exemple 1.37 Si Ω = { a, b, c} alors P (Ω) a 23 = 8 parties. On peut les énumérer :

• l’ensemble vide : ∅,
• 3 singletons : { a}, {b}, {c},
• 3 paires : { a, b}, { a, c}, {b, c},
• Ω tout entier : { a, b, c}.
1.2.7 Combinaisons avec répétition

Proposition 1.38 Soit Ω un ensemble de cardinal n et soit p un entier naturel non nul. Le nombre
p
de combinaisons avec répétition de p éléments parmi n est noté Kn et égal à
p p
Kn = Cn+ p−1 . (1.5)
Soient n ∈ N∗ et E = {e1 , . . . en }. Une combinaison de p éléments parmi n avec pos-

sibilité de répétition est une disposition de la forme [y1 , . . . , y p ] où chaque yi (i = 1, . . . , p)
est un élément de E. Elle peut être représentée par un n−uplet de la forme ( x1 , . . . xn ) où
xi (i = 1, . . . , n) représente le nombre de fois que l’élément ei apparaît dans la disposition
[y1 , . . . , y p ]. Les entiers xi sont alors liés par la relation x1 + · · · + xn = p.
Théorème 1.39 Soient n ∈ N∗ et p ∈ N. Le nombre de n−uplets ( x1 , x2 , . . . , xn ) ∈ Nn qui

vérifient la relation
x1 + x2 + · · · + x n = p
p p
est égal à Kn = Cn+ p−1 .
Application 1.40 De combien de façons peut-on distribuer 5 chemises identiques dans 2

tiroirs ?
1.3 E XERCICES
Exercice 1.1
1) Soient X, Y, A, B et C des sous-ensembles d’un ensemble Ω. En utilisant l’expression de
Card( X ∪ Y ), montrer que
Card( A ∪ B ∪ C ) = Card( A) + Card( B) + Card(C ) − Card( A ∩ B) − Card( A ∩ C )

− Card( B ∩ C ) + Card( A ∩ B ∩ C ). (1.6)
2) Parmi 40 secrétaires, 8 comprennent le russe, 15 l’anglais et 9 l’allemand. D’autre part, 4

comprennent l’anglais et l’allemand, 5 le russe et l’anglais, 2 l’allemand et le russe, 2 les
3 langues. Combien dénombre-t-on de secrétaires ne parlant aucune des trois langues ?
Exercice 1.2
1) On dispose de trois tiroirs notés A, B, C dans lesquels on doit ranger à sa guise 7 objets
discernables numérotés 1 à 7. On suppose que chaque tiroir est suffisamment grand pour
O
contenir tous les objets. Combien de rangements différents peut-on faire ?
LD
2) On dispose cette fois-ci de 3 objets discernables notés 1, 2, 3 et de 5 tiroirs notés A, B, C, D,
E mais l’on ne veut pas ranger deux objets dans un même tiroir. Combien de rangements
différents peut-on faire ?
A
ER
Exercice 1.3 On suppose que les numéros de téléphone à 8 chiffres peuvent comporter à
chaque position n’importe quel chiffre de 0 à 9. Combien de numéros de téléphone peut-on
former :
.G
1) au total ?
2) si les chiffres sont deux à deux distincts ?
C
3) si les numéros commencent par 22 ?

I.
4) si les numéros ne comportent que les chiffres 0, 2 et 3 ?

5) en utilisant seulement deux chiffres ?
6) si les numéros contiennent exactement deux fois le chiffre 5 ?
7) si les numéros contiennent exactement deux fois le chiffre 0, deux fois le chiffre 3 et
quatre fois le chiffre 2 ?
8) si les chiffres pairs et impairs doivent alterner ?
Exercice 1.4 Déterminer le nombre de numéros de téléphone à 7 chiffres tels que :

1) le numéro est formé de deux 1, deux 3 et trois 7 ;
2) le numéro est formé de deux chiffres distincts et deux seulement ;
3) le numéro est formé de trois 1 et trois seulement ;
4) la somme des chiffres du numéro est égale à 10.
Exercice 1.5 Quatre personnes se présentent à un entretien après lequel le recruteur a la

possibilité soit de ne choisir personne, soit d’en choisir une, deux, trois ou quatre. Quel est
le nombre total de possibilités ?
Exercice 1.6 Le tiercé est une forme de pari qui consiste à donner les trois premiers che-
vaux ayant franchi la ligne d’arrivée. Quinze (15) chevaux sont au départ d’un grand prix.
Combien y a-t-il de tiercés possibles :
1) au total ?
2) dans lesquels les 3 chevaux de tête sont prédits dans l’ordre ?
3) dans lesquels les 3 chevaux de tête sont prédits dans l’ordre ou le désordre ?
4) dans lesquels les 3 chevaux de tête sont prédits dans le désordre ?
Exercice 1.7 Lors d’un recrutement pour 4 postes identiques, 6 femmes et 8 hommes se
présentent. Combien de recrutements distincts sont possibles
1) au total ?
2) sachant que l’on embauche 2 hommes et 2 femmes ?
Exercice 1.8 Un facteur dispose de p enveloppes à répartir dans n boîtes aux lettres. On
suppose qu’une boîte peut contenir plusieurs enveloppes. De combien de façons peut se
faire cette répartition :
1) si les enveloppes sont distinctes ?
2) si les enveloppes sont identiques ?
Exercice 1.9 Une multinationale décide de lancer un dentifrice pour chien. Le nom de ce
nouveau produit doit comporter 3 lettres de l’alphabet. Déterminer les nombres :
1) N1 de noms que l’on peut fabriquer
2) N2 de noms contenant trois lettres distinctes
3) N3 de mots commençant et finissant par une consonne
4) N4 de mots contenant au moins une voyelle
5) N5 de mots contenant deux consonnes et une voyelle.
Exercice 1.10
1) Montrer que le nombre de façons de répartir n personnes en trois groupes de n1 , n2 et n3
personnes respectivement tels que n1 + n2 + n3 = n est égal à
n!
.
n1 !n2 !n3 !
2) Dans un commissariat, huit (08) agents de police sont répartis aléatoirement de telle
sorte qu’il y ait 3 agents de patrouille, 2 agents de garde au commissariat et 3 agents de
réserve. Quel est le nombre total de répartitions possibles ?
C HAPITRE 2
P HÉNOMÈNES ALÉATOIRES ET MODÈLE PROBABILISTE
Résumé – Ce chapitre introduit la notion de probabilité et présente le concept classique

d’équiprobabilité lié à un ensemble fini. L’objectif de ce chapitre est de savoir calculer des
probabilités dans un cadre d’équiprobabilité sur un ensemble fini.
Sommaire
O
2.1 Notion d’expérience aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2 Evénements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
LD
2.2.1 Notion d’événement . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.2 Langage des événements . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3 Espaces probabilisés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
A
2.3.1 Définition de la probabilité . . . . . . . . . . . . . . . . . . . . . . . 24

2.3.2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
ER
2.4 Notion d’équiprobabilité ou de probabilité uniforme . . . . . . . . . . . 26

2.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
.G
2.1 N OTION D ’ EXPÉRIENCE ALÉATOIRE

C
Les phénomènes dans lesquels apparaît souvent l’effet du hasard sont d’un grand inté-
I.
rêt dans plusieurs domaines très différents. A titre d’exemples, on peut citer les jeux de ha-
sard, les banques et la finance (arrivée des clients à un guichet, évaluation des capacités d’un
individu pris au hasard à rembourser un crédit avant de le lui octroyer, gestion de porte-
feuille par les compagnies boursières), la biologie (où le hasard est omniprésent et considéré
comme source de la diversité biologique des individus et de la variabilité des caractères),
la médecine (où on évalue les « chances » de succès de divers traitements), l’électronique
(durée de vie des composantes électroniques), l’informatique (théorie des graphes, filtrage
de spams, théorie des files d’attente et des réseaux), l’assurance (évaluation des risques de
sinistres, primes payées par les assurés), etc. . .
Définition 2.1
• Une expérience aléatoire est une expérience dont il est impossible de prévoir le résul-
tat, c’est-à-dire, qui répétée dans des conditions identiques, peut donner des résultats
différents.
21
• L’ensemble des résultats possibles, souvent noté Ω, est appelé univers des possibles (ou
tout simplement univers) ou encore espace fondamental.
Exemple 2.2 Voici quelques exemples d’expériences aléatoires et les univers qu’on peut
leur associer :
TABLE 2.1 – Exemples d’expériences aléatoires et d’univers associés
Expérience Univers des possibles

Jet d’un dé à six faces Ω = {1, 2, 3, 4, 6}
Jet de deux dés Ω = {1, . . . , 6}2 = {(i, j) ∈ N2 | 1 ⩽ i, j ⩽ 6}
Lancer d’une pièce Ω = {pile, face}
Durée de fonctionnement d’un ap- Ω = R+
pareil
Bien que le résultat précis d’une expérience aléatoire soit imprévisible, l’observation et
l’intuition amènent à penser que ces phénomènes obéissent à certaines lois. La théorie des
probabilités vise à fournir un modèle mathématique pour décrire ces phénomènes. Un modèle
associé à une expérience aléatoire contient trois objets mathématiques essentiels :
• l’espace fondamental Ω,
• une classe A de sous-ensembles de Ω appelés événements,
• une probabilité P sur l’espace (Ω, A), c’est-à-dire l’affectation d’un poids à chaque
événement traduisant la « chance » de réalisation dudit événement.
2.2 E VÉNEMENTS
2.2.1 Notion d’événement
La théorie des probabilités utilise le langage des ensembles pour modéliser une expé-
rience aléatoire. Dans toute la suite, nous considérerons une expérience aléatoire d’univers
Ω.
Définition 2.3
• Un événement A est une propriété dont on peut dire si elle est vraie ou non, une fois
l’expérience accomplie. On dira que l’événement A est réalisé ou non suivant que la
propriété est vraie ou fausse une fois l’expérience accomplie.
• Un événement A est aussi identifié à l’ensemble, encore noté A, de tous les éléments
de Ω pour lesquels ladite propriété est vraie. Si A est l’ensemble associé à un événe-
ment et si le résultat de l’expérience ω ∈ A alors ledit événement est dit réalisé.
Chapitre 2. Phénomènes aléatoires et modèle probabiliste 23
Exemple 2.4 On jette un dé. Soit A l’événement « le résultat obtenu est pair ». L’univers des
possibles est Ω = {1, 2, 3, 4, 5, 6}. L’événement A correspond à l’ensemble A = {2, 4, 6}. Si
l’expérience donne comme résultat 2 alors A est réalisé mais si le résultat est 5 alors A n’est
pas réalisé.
2.2.2 Langage des événements

Avec le mode de représentation mathématique des événements introduit ci-dessus, les
opérations sur les événements se traduisent par des opérations ensemblistes. Le tableau 2.2
donne la correspondance entre les deux langages.
TABLE 2.2 – Tableau de correspondance entre le langage des événements et celui des ensembles
Vocabulaire probabiliste Vocabulaire ensembliste Notation

Evénement certain Ensemble entier Ω
Evénement impossible Ensemble vide ∅
O
Evénement élémentaire Singleton {ω }
Evénement contraire de A Complémentaire de A A
LD
A et B Intersection de A et B A∩B
A ou B (ou non exclusif) Réunion de A et B A∪B
A
A et B sont incompatibles A et B sont disjoints A∩B = ∅

ER
Exemple 2.5 On reprend l’exemple du jet d’un dé à six faces numérotées de 1 à 6.

.G
1) L’événement A : « Obtenir le chiffre 7 » est impossible.

2) L’événement B : « Obtenir un chiffre inférieur ou égal à 7 » est certain.
C
3) Les événements C : « Obtenir un chiffre pair » et D : « Obtenir un chiffre impair » sont

contraires et incompatibles.
I.
Remarque 2.6 Les opérations sur les événements peuvent bien sûr faire intervenir plus de
deux événements. Ainsi, si A1 , . . . , An sont des événements,
n
[
A i = A1 ∪ A2 ∪ · · · ∪ A n
i =1
est l’ensemble des éléments qui sont dans l’un au moins des Ai . C’est donc l’événement
« réalisation de l’un au moins des Ai (1 ⩽ i ⩽ n) ».
De même :
n
\
A i = A1 ∩ A2 ∩ · · · ∩ A n
i =1
est l’ensemble des éléments qui sont dans tous les Ai . C’est donc l’événement
« réalisation de tous les Ai (1 ⩽ i ⩽ n) ».
Application 2.7 Soit A, B, C trois événements associés à une même expérience aléatoire.
Traduire en termes ensemblistes (en utilisant uniquement les symboles d’union, d’intersec-
tion et de passage au complémentaire, ainsi que A, B et C) les événements suivants :
1) Seul A se réalise ;
2) A et B se réalisent mais pas C ;
3) les trois événements se réalisent ;
4) au moins l’un des trois événements se réalise ;
5) aucun ne se réalise ;
6) exactement deux des trois se réalisent.
Définition 2.8 (Système complet d’événements) Une famille d’événements A1 , A2 , . . ., An

forme un système complet d’événements si les parties A1 , A2 , . . ., An vérifient les conditions
suivantes :
1) chaque Ai est non vide ;
2) Les parties Ai sont deux à deux incompatibles : ∀i, j ∈ {1, . . . , n}, i ̸= j =⇒ Ai ∩ A j = ∅ ;
n
[
3) La réunion des Ai donne Ω i.e. Ai = Ω.
i =1
Exemple 2.9 Soit A un événement différent de l’événement impossible et de l’événement

certain Ω. Les événements A et A forment un système complet d’événements.
Exemple 2.10 Reprenons l’exemple du lancer d’un dé à six faces dont l’univers des pos-
sibles est Ω = {1, 2, 3, 4, 5, 6}. Alors,
• les événements A = {1, 3, 5} (le résultat est impair) et A = {2, 4, 6} (le résultat est
impair) forment un système complet d’événements ;
• les événements C = {1, 2} (le résultat est inférieur ou égal à 2) et D = {3, 4, 5, 6} (le ré-
sultat est strictement supérieur à 2) forment aussi un système complet d’événements.
2.3 E SPACES PROBABILISÉS

2.3.1 Définition de la probabilité
Nous commençons par introduire les notions de tribu et d’espace probabilisable, préa-
lables à la définition d’une probabilité.
Définition 2.11 On appelle tribu sur Ω, tout sous-ensemble A de P (Ω) vérifiant les trois
propriétés suivantes :
1) Ω ∈ A ;
2) si A ∈ A alors A ∈ A (stabilité par passage au complémentaire) ;
∞
[
3) si ( Ai )i∈N est une suite d’événements de A, alors Ai ∈ A (stabilité par l’union dé-
i =1
nombrable).
Le couple (Ω, A) est alors appelé espace probabilisable.
Exemple 2.12 Pour tout ensemble Ω,

1) la famille P (Ω) des parties de Ω, est une tribu ;
2) la famille {∅, Ω} est une tribu appelée tribu triviale sur Ω.
Remarque 2.13 Dans les exemples et exercices donnés dans la suite du cours, et sauf men-
tion contraire, nous supposerons A = P (Ω).
O
Définition 2.14 (Probabilité) On appelle probabilité sur un espace probabilisable (Ω, A),
toute application P définie de A dans [0, 1] telle que :
LD
1) P(Ω) = 1 ;
2) pour toute suite ( Ai )i∈N d’événements deux à deux incompatibles :
A
!
∞
[ ∞
ER
P Ai = ∑ P( A i ). (σ − additivité de P)
i =0 i =0
G
Le triplet (Ω, A, P) est appelé espace probabilisé ou espace de probabilité. Le nombre P( A)

s’appelle la probabilité de l’événement A.
C.
On emploie souvent, dans certaines situations, l’expression loi de probabilité au lieu de

I.
probabilité.
2.3.2 Propriétés
Théorème 2.15 Soit (Ω, A, P) un espace probabilisé. Les propriétés suivantes sont satisfaites :
1) Pour tout A ∈ A, on a : P( A) ∈ [0, 1].
2) P(∅) = 0.
3) Pour tous événements A1 , . . . , An deux à deux incompatibles, on a :
!
n
[ n
P Ai = ∑ P( A i ).
i =1 i =1
En particulier, pour deux événements incompatibles A et B, on a :
P( A ∪ B ) = P( A ) + P( B ).
4) Si A et B sont des événements quelconques, on a
P( A ∪ B ) = P( A ) + P( B ) − P( A ∩ B ). (2.1)
5) Pour tout A ∈ A, on a : P( A) = 1 − P( A).

6) Pour deux événements A et B,
P( A \ B ) = P( A ) − P( A ∩ B ) (2.2)
P( A∆B) = P( A \ B) + P( B \ B). (2.3)
7) Si A, B ∈ A et si A ⊂ B, alors P( A) ⩽ P( B).
2.4 N OTION D ’ ÉQUIPROBABILITÉ OU DE PROBABILITÉ

UNIFORME
La théorie des probabilités ne dit pas quelle loi de probabilité mettre sur un ensemble Ω
parmi toutes les nombreuses lois possibles. Nous présentons ici l’équiprobabilité ou proba-
bilité uniforme mais évidemment il existe bien d’autres façons de définir une loi de proba-
bilité, chacune ayant des avantages et des limites. Quelque soit la loi choisie, il faut garder
à l’esprit qu’un modèle probabiliste n’est qu’une représentation de la réalité et ses hypo-
thèses doivent être mises à l’épreuve des faits.
Lorsque Ω est fini et si les conditions de l’expérience le permettent, on considère a priori

que les événements élémentaires ont la même probabilité : on parle d’équiprobabilité ou de
probabilité uniforme.
Définition 2.16 Soit Ω = {ω1 , . . . , ωn } un univers fini. L’équiprobabilité ou probabilité uni-

forme sur Ω est définie par :
1
P({ωi }) = , ∀i = 1, . . . , n. (2.4)
n
Exemple 2.17 Si l’expérience aléatoire consiste à jeter un dé parfait (non truqué) à six faces
numérotées de 1 à 6, on peut supposer que toutes les faces ont la même probabilité d’appa-
raître qui égale à 1/6.
Le calcul des probabilités n’est donc plus qu’une affaire de dénombrement, d’où la cé-
lèbre formule suivante.
Proposition 2.18 Soient n ∈ N∗ , Ω = {ω1 , . . . , ωn } un univers fini et (Ω, A, P) un espace pro-

babilisé. Si P représente l’équiprobabilité (ou probabilité uniforme) sur Ω, alors pour tout événement
A ∈ A,
Card( A) Nombre de cas favorables à A
P( A ) = = . (2.5)
Card(Ω) Nombre de cas possibles
Application 2.19 Dans une urne contenant dix boules indiscernables au toucher numéro-
tées de 0 à 9, on tire successivement trois boules avec remise et on relève dans l’ordre les
trois chiffres obtenus. Décrire le triplet (Ω, A, P) associé à cette expérience et calculer la
probabilité de chacun des évènements suivants :
1) A : « Les trois chiffres obtenus sont identiques ».
2) B : « Les trois chiffres obtenus sont deux à deux distincts ».
3) C : « On n’obtient pas le chiffre 4 ».
4) D : « On obtient le chiffre 4 au moins une fois ».
5) E : « Le second chiffre est pair ».
6) F : « Les deux premiers chiffres sont pairs ».
7) G : « L’un des deux premiers chiffres au moins est pair ».
O
LD
A
ER
.G
C
I.
2.5 E XERCICES
Exercice 2.1 Trois boules sont tirées successivement d’une urne contenant des boules blanches
et des boules rouges. Pour tout i ∈ {1, 2, 3}, on définit l’événement :
Ai = « la boule no i est blanche ».
Exprimer à l’aide des événements A1 , A2 et A3 les événements suivants :
B = « toutes les boules tirées sont blanches »,

C = « les deux premières sont blanches »,
D = « au moins une boule est blanche »,
E = « seule la troisième est blanche »,
F = « une seule boule est blanche ».
Exercice 2.2 On procède à deux jets consécutifs d’un dé parfaitement équilibré dont les
faces sont numérotées de 1 à 6 et on relève à chaque fois le numéro obtenu sur la face su-
périeure du dé. On considère ensuite les deux événements : A « la somme des numéros
obtenus est impaire » ; B « le numéro 1 est obtenu au moins une fois ». Calculer les probabi-
lités des événements : A, B, A ∩ B, A ∪ B, A ∩ B.
Exercice 2.3 On relève les dates d’anniversaire dans un groupe de 30 personnes (jours nu-
mérotés de 1 à 365). On suppose que les jours de naissance sont équiprobables. Quelle est
la probabilité que deux personnes au moins aient le même anniversaire ?
Exercice 2.4 Une entreprise a ses sites de productions répartis sur trois pays : A, B et C.
Cette entreprise a 4 sites de production dans le pays A, 6 dans le pays B et 9 dans le pays C.
On cherche à sélectionner trois sites pour y installer des centres de recherche.
1) De combien de façons peut-on choisir ces trois sites ?
2) Quelle est la probabilité que chaque pays dispose d’un centre de recherche ?
3) Quelle est la probabilité qu’un seul pays dispose de tous les centres de recherche ?
Exercice 2.5 On effectue cinq lancers d’un dé cubique parfaitement équilibré dont les faces
sont numérotées de 1 à 6. On relève les numéros obtenus sur les faces supérieures du dé.
Déterminer la probabilité des événements suivants :
1) A : « on n’a pas obtenu la face 6 ».
2) B : « on a obtenu exactement une seule fois la face 6 ».
3) C : « on a obtenu au moins deux fois la face 6 ».
4) D : « on a obtenu 1 pour la première fois au cinquième lancer ».
5) E : « on a obtenu exactement deux fois la face 6 ».
6) F : « on a obtenu exactement deux fois la face 6 et une fois la face 4 ».
Exercice 2.6 Trois personnes vont au cinéma. Il passe trois films différents. Chaque per-
sonne choisit son film au hasard sans tenir compte du choix des autres. Quelle est la proba-
bilité que :
1) les trois personnes aient vu les trois films différents ?
2) les trois personnes aient vu le même film ?
3) deux personnes exactement aient vu le même film ?
4) au moins deux personnes aient vu le même film ?
Exercice 2.7 Dix-huit (18) personnes se sont présentées à une collecte de sang. Parmi celles-
ci, on a noté : 11 personnes du groupe O, 4 personnes du groupe A, 2 personnes du groupe
B et 1 personne du groupe AB. A l’issue de la collecte, on prélève au hasard 3 flacons parmi
les 18 flacons obtenus. Calculer la probabilité des événements suivants :
1) E1 = « les 3 flacons appartiennent au même groupe »
2) E2 = « parmi les 3 flacons prélevés, il y a au moins un flacon contenant du sang du groupe
A»
O
3) E3 = « les sangs des 3 flacons appartiennent à des groupes différents »
LD
Exercice 2.8 On compose au hasard un numéro de téléphone à 8 chiffres. Quelle est la pro-
babilité pour que :
A
1) tous les chiffres du numéro soient distincts ?

ER
2) le produit des chiffres soit divisible par 2 ?

3) les chiffres forment une suite strictement croissante ?
.G
4) les chiffres forment une suite croissante au sens large ?
Exercice 2.9 On range au hasard 10 livres notés L1 , . . ., L10 sur une étagère. Quelle est la
C
probabilité p pour que 3 livres donnés (par exemple L1 , L4 et L10 ) soient rangés côte à côte ?
I.
C HAPITRE 3
P ROBABILITÉ CONDITIONNELLE ET INDÉPENDANCE
Résumé – Ce chapitre présente les concepts de probabilité conditionnelle et d’indépen-

dance. Deux importantes formules, le théorème des probabilités totales et la formule de
Bayes, y sont présentées. L’objectif est de savoir calculer des probabilités dans un contexte
de probabilités conditionnelles.
Sommaire
O
3.1 Introduction et définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
LD
3.2 Notion d’indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.1 Indépendance de deux événements . . . . . . . . . . . . . . . . . . 32
3.2.2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
A
3.2.3 Incompatibilité et indépendance . . . . . . . . . . . . . . . . . . . . 33

ER
3.2.4 Indépendance mutuelle . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.3 Formules importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.3.1 Théorème des probabilités totales . . . . . . . . . . . . . . . . . . . 34
.G
3.3.2 Formule de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
C
3.1 I NTRODUCTION ET DÉFINITION

I.
Soit (Ω, A, P) l’espace probabilisé associé à une expérience aléatoire. Nous avons vu
dans le chapitre précédent que la probabilité d’un événement A ∈ A pouvait être consi-
dérée comme une quantification a priori (c’est-à-dire avant la réalisation de l’expérience)
des « chances » de réalisation de A. Si l’on dispose d’une information supplémentaire sur
la réalisation d’un autre événement B, il est logique de penser que cette nouvelle informa-
tion pourrait modifier les « chances » de voir A se réaliser. Illustrons cela à l’aide l’exemple
suivant :
Exemple 3.1 Dans un groupe de 100 personnes, il y a 40 femmes dont 10 sont au chômage
et 60 hommes dont 10 sont chômage.
1) Si on tire une personne au hasard dans la population, la probabilité qu’elle soit au chô-
mage est
20
p1 = = 0.2
100
31
car il y a au total 20 personnes (10 hommes et 10 femmes) au chômage.

2) Maintenant, si on suppose que la personne tirée est une femme, la probabilité qu’elle
soit au chômage est
10
p2 = = 0.25.
40
La notion de probabilité conditionnelle abordée dans ce chapitre va permettre, dans
une certaine mesure, de rendre compte de l’information apportée par la réalisation d’un
événement donné sur la réalisation (éventuelle) d’un autre événement.
Théorème – Définition 3.2 Soient (Ω, A, P) un espace probabilisé et B un événement de proba-

bilité P( B) > 0. Alors la fonction d’ensembles P(·| B), définie pour tout événement A ∈ A par
P( A ∩ B )
P( A | B ) = (3.1)
P( B )
est une probabilité sur (Ω, A). On l’appelle probabilité conditionnelle sachant B.
Application 3.3 On lance deux fois un dé parfaitement équilibré dont les faces sont numé-
rotées de 1 à 6. Quelle est la probabilité d’obtenir la face 6 au premier lancer sachant que la
somme des chiffres obtenus vaut 8 ?
▶▶▶ Réponse : On pourra munir l’univers Ω de l’équiprobabilité et considérer les événe-

ments A : « Obtenir la face 6 au premier lancer » et B : « la somme des chiffres obtenus vaut
8 ». On pourra alors vérifier que P( A| B) = 1/5.
Remarque 3.4 La probabilité conditionnelle étant avant tout une probabilité, elle vérifie
donc les propriétés données par la Proposition 2.15 (page 25).
3.2 N OTION D ’ INDÉPENDANCE

3.2.1 Indépendance de deux événements
Définition 3.5 Soit (Ω, A, P) un espace probabilisé. Deux événements A et B sont indépen-
dants pour la probabilité P s’ils vérifient la propriété :
P( A ∩ B ) = P( A )P( B ). (3.2)
Application 3.6 On lance deux fois de suite un dé parfaitement équilibré et on note les
deux chiffres obtenus. On considère les événements A : « le premier chiffre est pair » et
B : « le second chiffre est supérieur ou égal à 5 ». Vérifier que les événements A et B sont
indépendants.
Chapitre 3. Probabilité conditionnelle et indépendance 33
Remarque 3.7 Si deux événements A et B sont indépendants, alors la probabilité de réali-

sation de l’un n’est pas modifiée par une information concernant la réalisation de l’autre,
c’est-à-dire P( A| B) = P( A) et P( B| A) = P( B).
3.2.2 Propriétés
Proposition 3.8 Si A et B sont deux évènements indépendants alors les événements A et B, A et
B, A et B le sont aussi.
Le lecteur pourra faire la preuve comme exercice.
3.2.3 Incompatibilité et indépendance

Il ne faut pas confondre les notions d’incompatibilité et d’indépendance. Deux événe-
ments A et B sont incompatibles si A ∩ B = ∅ c’est-à-dire que A et B ne peuvent pas se
réaliser au même moment. Par contre A et B sont indépendants si la réalisation de l’un
n’influence pas la réalisation de l’autre.
O
Exemple 3.9 On lance un dé parfaitement équilibré à six faces numérotées de 1 à 6. On
LD
considère les événements A : « le chiffre obtenu est pair » et B : « le chiffre obtenu est 5 ».
L’ensemble fondamental associé à cette expérience est Ω = {1, . . . , 6}. On peut vérifier que
A ∩ B = ∅ et
A
3 1 1
P( A ) = = et P( B) = .
ER
6 2 6
Les événements A et B sont incompatibles mais ne sont pas indépendants puisque 0 =
P( A ∩ B ) ̸ = P( A ) × P( B ).
.G
3.2.4 Indépendance mutuelle

C
Définition 3.10 Soit (Ω, A, P) un espace probabilisé. Les événements A1 , A2 , . . . , An sont

I.
dits mutuellement indépendants si pour toute partie I de l’ensemble des indices allant de 1 à
n on a : !
\
P Ai = ∏ P( A i ).
i∈ I i∈ I
Remarque 3.11 L’indépendance mutuelle entraîne l’indépendance deux à deux mais la ré-
ciproque est fausse. En d’autres termes, l’indépendance mutuelle est beaucoup plus forte
que l’indépendance deux à deux. Par exemple, on dira que trois événements A1 , A2 et A3
sont mutuellement indépendants si les quatre égalités suivantes sont vérifiées :


 P( A1 ∩ A2 ) = P( A1 )P( A2 )

P( A1 ∩ A3 ) = P( A1 )P( A3 )

 P ( A2 ∩ A3 ) = P( A2 )P( A3 )

P( A1 ∩ A2 ∩ A3 ) = P( A1 )P( A2 )P( A3 ).
Exemple 3.12 On lance deux fois un dé équilibré. Soient les événements A1 = « le 1er
nombre obtenu est pair », A2 = « le 2ème nombre obtenu est impair », A3 = « la somme
des deux nombres est paire ». On vérifie que Card(Ω) = 36, P( A1 ) = P( A2 ) = P( A3 ) =
18/36 = 1/2, P( A1 ∩ A2 ) = P( A1 ∩ A3 ) = P( A2 ∩ A3 ) = 1/4 et P( A1 ∩ A2 ∩ A3 ) = 0. Les
trois événements sont deux à deux indépendants mais ne sont pas mutuellement indépen-
dants.
3.3 F ORMULES IMPORTANTES

3.3.1 Théorème des probabilités totales
Soient (Ω, A, P) un espace probabilisé et A un événement de probabilité non nulle.
On considère un système complet d’événements B1 , . . . , Bn représentant par exemple l’en-
semble de toutes les causes possibles de réalisation de A. On a :
!
n
[ n
[
A = A∩Ω = A∩ Bi = ( A ∩ Bi ).
i =1 i =1
La première égalité est justifiée par le fait que A ⊂ Ω, la seconde par le fait que le système
( Bi ) est un système complet d’événements et la dernière, par la distributivité de l’intersec-
tion par rapport à la réunion . Comme les Bi sont deux à deux disjoints et que A ∩ Bi ⊂ Bi ,
alors les A ∩ Bi sont aussi deux à deux disjoints d’où
!
n
[ n
P( A ) = P ( A ∩ Bi ) = ∑ P( A ∩ Bi ). (3.3)
i =1 i =1
Finalement, en tenant compte de la relation P( A| Bi ) = P( A ∩ Bi )/P( Bi ), on en déduit que

P( A ∩ Bi ) = P( A| Bi )P( Bi ). On obtient alors la très importante formule suivante :
Théorème 3.13 (Formule des probabilités totales) Soient (Ω, A, P) un espace probabilisé, A
un événement et B1 , . . . , Bn un système complet d’événements tel que P( Bi ) > 0 pour chaque
i = 1, . . . , n. On a :
n
P( A ) = ∑ P( A| Bi )P( Bi ). (3.4)
i =1
Application 3.14 Une compagnie d’assurance assure un nombre égal de conducteurs mas-
culins et féminins. On suppose défini un espace probabilisé (Ω, A, P) où Ω est l’ensemble
des assurés. On estime la probabilité d’avoir un accident dans l’année à α = 0.3 pour un
conducteur (masculin) et β = 0.1 pour une conductrice. La compagnie sélectionne un as-
suré au hasard. On souhaite déterminer la probabilité pour que la personne sélectionnée
ait un accident pendant l’année. On considère pour cela les événements M : « La personne
sélectionnée est de sexe masculin », F : « La personne sélectionnée est de sexe féminin » et
A : « La personne sélectionnée a un accident ».
1) Calculer P( M ), P( F ), P( A| M) et P( A| F ).
2) Vérifier que F et M forment un système complet d’événements.
3) Calculer alors P( A).
3.3.2 Formule de Bayes

On conserve les notations de la sous-section précédente. Considérons une des causes
susceptibles de réaliser l’événement A, la cause Bk par exemple. On suppose l’événement A
réalisé et on cherche à déterminer la probabilité que la cause Bk ait provoqué la réalisation
de A c’est-à-dire P( Bk | A). Pour tout k ∈ {1, . . . , n}, on a :
P( Bk ∩ A) P( A ∩ Bk ) P( A| Bk )P( Bk )
P( Bk | A) = = = .
P( A ) P( A) P( A )
En utilisant la formule (3.4), on obtient le théorème suivant qui porte le nom de formule de
Bayes 1 .
Théorème 3.15 (Formule de Bayes) Soient (Ω, A, P) un espace probabilisé, A un événement et

B1 , . . . , Bn un système complet d’événements tel que P( Bi ) > 0 pour chaque i = 1, . . . , n. Si
P( A) > 0, alors on a :
P( A| Bk )P( Bk )
∀k ∈ {1, . . . , n}, P( Bk | A) = . (3.5)
∑in=1 P( A| Bi )P( Bi )
O
LD
Exemple 3.16 Lorsque le système complet est constitué d’un événement B et son contraire
B tous deux de probabilité non nulle, la formule (3.5) se simplifie en :
P( A | B )P( B )
A
P( B | A ) = .
P( A | B )P( B ) + P( A | B )P( B )
ER
Application 3.17 Dans une usine trois machines M1 , M2 , M3 fabriquent des boulons de
.G
même type. La machine M1 sort en moyenne 0.3 % de boulons défectueux, M2 0.8 % et M3

1 %. On mélange 1000 boulons dans une caisse, 500 provenant de M1 , 350 de M2 et 150
de M3 . On tire un boulon au hasard dans la caisse et on constate qu’il est défectueux. On
C
souhaite répondre à la question suivante : « quelle est la probabilité qu’il ait été fabriqué par
la machine M1 ? ». On considère les événements Mi : « le boulon tiré provient de la machine
I.
i » (i = 1, 2, 3) et D : « le boulon tiré est défectueux ».

1) Traduire les hypothèses de l’énoncé en termes de probabilités et de probabilités condi-
tionnelles.
2) Répondre alors à la question posée par l’énoncé.
▶▶▶ Réponse : On pourra utiliser la formule (3.5) et vérifier que la réponse finale est 0.26.
1. Thomas Bayes ((1701 ou 1702) - 1761), mathématicien et pasteur britannique

3.4 E XERCICES
Exercice 3.1 Parmi les vols quittant une ville V1 pour une ville V2 , 89.5% partent à l’heure
(événement D) et arrivent à destination à l’heure (événement A), 3.5% partent à l’heure et
arrivent en retard, 1.5% partent en retard et arrivent à l’heure, et 5.5% partent en retard et
arrivent en retard.
1) Traduire les données de l’énoncé et expliquer pourquoi elles sont cohérentes.
2) Quelle est la probabilité
(a) qu’un vol parte à l’heure ?
(b) qu’un vol arrive en retard ?
(c) qu’un vol arrive à l’heure sachant qu’il est parti à l’heure ?
(d) qu’un vol arrivé en retard soit parti en retard ?
Exercice 3.2 On considère une communauté où chaque membre a un ordinateur sur lequel
est installé un seul système d’exploitation. On suppose que 30% des membres utilisent Ma-
cintosh, 50% utilisent Windows et 20% utilisent Linux. Au cours d’une opération sur Inter-
net, un virus informatique s’attaque à tous les PC. On apprend que ledit virus a infecté 65%
des utilisateurs de Mac, 82% des utilisateurs de Windows et 50% des utilisateurs de Linux.
On choisit une personne au hasard et on considère les événements M : « la personne pos-
sède Macintosh », W : « la personne possède Windows », L : « la personne possède Linux »,
I : « le PC de la personne est infectée par le virus ».
1) Traduire les hypothèses de l’énoncé.
2) On apprend que le système de la personne choisie a été infecté par un virus. Quelle est
la probabilité qu’elle soit un utilisateur de Windows ?
Exercice 3.3 Dans une association, deux bénévoles A et B collent des timbres sur des en-
veloppes. Le travail est réparti entre les deux bénévoles de telle sorte que A traite 40% des
enveloppes et B 60%. Sous l’effet de la fatigue, A omet de mettre un timbre dans 3% des cas
et B dans 2% des cas. On choisit une enveloppe au hasard.
1) Calculer la probabilité qu’elle ne porte pas de timbre.
2) Sachant qu’elle ne porte pas de timbre, calculer la probabilité qu’elle ait été traitée par
A.
Exercice 3.4 On considère une population composée de 48% d’hommes et de 52% de femmes.
La probabilité qu’un homme soit daltonien est 0.05, la probabilité qu’une femme soit dal-
tonienne est 0.0025. On choisit une personne au hasard dans la population. Quelle est la
probabilité qu’elle soit daltonienne ?
Exercice 3.5 Soient A et B deux événements tels que P( A) = 1/5 et P( A ∪ B) = 1/2.

Calculer P( B) dans chacun des cas suivants :
1) A et B sont incompatibles.
2) A et B sont indépendants.
Exercice 3.6 On jette deux dés parfaitement équilibrés dont les faces sont numérotées de 1
à 6. Soit A l’événement « la somme des chiffres indiqués est impaire » et soit B l’événement
« l’un des dés indique le chiffre 1 ». Les événements A et B sont-ils indépendants ?
Exercice 3.7 On dispose de deux urnes contenant des boules indiscernables au toucher.
L’urne 1 contient trois boules blanches et une boule noire. L’urne 2 contient une boule
blanche et deux boules noires. On lance un dé non truqué. Si le dé donne un numéro in-
férieur ou égal à 2, on tire une boule dans l’urne 1. Sinon on tire une boule dans l’urne 2.
On considère les événements B : « la boule tirée est blanche » et Ui : « la boule est tirée dans
l’urne i », i ∈ {1, 2}.
1) Calculer les probabilités P(U1 ), P(U2 ), P( B|U1 ) et P( B|U2 ).
2) Calculer la probabilité de tirer une boule blanche.
3) On suppose que la boule tirée est blanche. Calculer le probabilité qu’elle provienne de
l’urne 1 ?
Exercice 3.8 Vous contactez deux amis A et B afin de former un groupe de travail de ma-
O
thématiques. La probabilité que l’ami A accepte est de 0.2 et celle que l’ami B accepte est de
0.6. De plus, sachant que l’ami A a accepté, l’ami B acceptera avec une probabilité de 0.7.
LD
Calculer la probabilité que :
1) vos deux amis acceptent ;
A
2) l’ami A accepte sachant que B a accepté ;

ER
3) seul l’ami A accepte ;

4) l’un au moins de vos deux amis accepte ;
.G
5) aucun de vos deux amis n’accepte.
Exercice 3.9 Un test médical pour une maladie M donne deux résultats possibles : + et −.
C
Les probabilités sont données par : P(+ ∩ M ) = 0.009, P(+ ∩ M) = 0.099, P(− ∩ M ) =
0.001 et P(− ∩ M ) = 0.891.
I.
1) Calculer P( M), P( M), P(+| M ), P(−| M ), P(+| M) et P(−| M). Les interpréter.
2) Quelle est la probabilité d’avoir la maladie sachant que le test est positif ? Ce test vous
semble-t-il fiable ?
Exercice 3.10 Trois personnes A, B et C tirent sur un oiseau. On suppose que les tirs sont
indépendants les uns des autres et que les probabilités de succès sont respectivement 70%,
50% et 90%. Calculer la probabilité que l’oiseau soit touché
1) en calculant d’abord la probabilité de l’événement contraire ;
2) en utilisant l’expression de P( A ∪ B ∪ C ).
Exercice 3.11 Pour se rendre à l’université, un étudiant a le choix entre 4 itinéraires : A, B,

C et D. La probabilité qu’il a de choisir l’itinéraire A (resp. B, C) est 31 (resp. 14 , 12
1
). La pro-
1 1 1
babilité d’arriver en retard en empruntant A (resp. B, C) est 20 (resp. 10 , 5 ). En empruntant
D, il n’est jamais en retard. Calculer la probabilité pour que :
1) l’étudiant choisisse l’itinéraire D ?

2) l’étudiant arrive en retard ?
3) l’étudiant ait emprunté l’itinéraire C sachant qu’il est arrivé en retard ?
Exercice 3.12 La proportion des pièces défectueuses dans un lot est de 0.05. Le contrôle de
fabrication des pièces est tel que :
◦ Si la pièce est bonne, elle est acceptée avec une probabilité de 0.96.
◦ Si la pièce est mauvaise, elle est refusée avec probabilité 0.98.
On choisit une pièce au hasard et la contrôle. Probabilité pour :
1) qu’il y ait une erreur de contrôle ?
2) qu’une pièce acceptée soit mauvaise ?
C HAPITRE 4
G ÉNÉRALITÉS SUR LES VARIABLES ALÉATOIRES
Résumé – Ce chapitre présente la notion de variable aléatoire (v.a.) et ses caractéristiques

fonctionnelles et numériques (densité, fonction de répartition, espérance, variance). L’ob-
jectif est de savoir faire des calculs relatifs à ces caractéristiques.
Sommaire
O
4.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2 Variables aléatoires discrètes et continues . . . . . . . . . . . . . . . . . . 40
LD
4.2.1 Variables aléatoires discrètes . . . . . . . . . . . . . . . . . . . . . . 40
4.2.2 Variables aléatoires continues . . . . . . . . . . . . . . . . . . . . . . 42
4.3 Moments d’une variable aléatoire . . . . . . . . . . . . . . . . . . . . . . . 43
A
4.3.1 Espérance mathématique . . . . . . . . . . . . . . . . . . . . . . . . 43

4.3.2 Variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
ER
4.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
.G
4.1 G ÉNÉRALITÉS
C
Dans ce chapitre, on considère une expérience aléatoire dont l’espace fondamental est
noté Ω. Une variable aléatoire X est une grandeur numérique inconnue dont la valeur
I.
dépend exclusivement du résultat de ladite expérience (d’où la terminologie « variable »).

Avant de réaliser l’expérience, on connaît l’ensemble X (Ω) des valeurs possibles pour X
mais on ne sait pas encore quelle valeur X va effectivement prendre lorsqu’on réalise l’ex-
périence. Illustrons cela à l’aide d’un exemple.
Exemple 4.1 On jette 3 fois une pièce de monnaie. L’espace fondamental est Ω = {P, F}3
où P et F désignent respectivement « Pile » et « Face ». On désigne par X le nombre de fois
que P apparaît. L’ensemble des valeurs prises par X est X (Ω) = {0, 1, 2, 3}. Si l’expérience
donne comme résultat ω = (P, P, F) par exemple, alors X (ω ) = 2.
Pour tout sous-ensemble A ⊂ X (Ω), l’ensemble

X −1 ( A ) = { ω ∈ Ω | X ( ω ) ∈ A }
est appelé l’image inverse de A. Par exemple, en reprenant l’expérience de l’exemple 4.1,
on a
X −1 ({2}) = {(P, P, F), (P, F, P), (F, P, P)}
39
qui correspond à l’événement « on obtient 2 fois Pile ».
Voici maintenant la définition générale d’une variable aléatoire.
Définition 4.2 Soient (Ω, A) et ( E, E ) deux espaces probabilisables.

• Une variable aléatoire (v.a.) X à valeurs dans E est une application de Ω dans E telle
que pour tout A ∈ E , l’on a X −1 ( A) ∈ A, où l’ensemble
X −1 ( A ) = { ω ∈ Ω | X ( ω ) ∈ A }
est l’image inverse de A par l’application X.

• Lorsque E = R, on parle de v.a. réelle (v.a.r.) et lorsque E = Rn , on parle de vecteur
aléatoire.
Théorème – Définition 4.3 Soit X une v.a. réelle définie sur un espace probabilisé (Ω, A, P) à
valeurs dans un espace probabilisable ( E, E ). Alors, l’application PX définie par :
PX : E −→ [0, 1], A 7−→ PX ( A) = P( X −1 ( A)) (4.1)
définit une probabilité sur ( E, E ). Pour tous A ⊂ X (Ω) et x ∈ X (Ω), on note :
P( X ∈ A) = P( X −1 ( A)) = P ({ω ∈ Ω | X (ω ) ∈ A})

P( X = x ) = P( X −1 ({ x })) = P ({ω ∈ Ω | X (ω ) = x }) .
Application 4.4 On reprend l’exemple 4.1. Calculer P( X = 2) et P( X > 2).
4.2 VARIABLES ALÉATOIRES DISCRÈTES ET CONTINUES

4.2.1 Variables aléatoires discrètes
Définition 4.5 Une variable aléatoire définie sur un espace probabilisé (Ω, A, P) est dite
discrète si l’ensemble des valeurs prises par X, noté X (Ω), est fini ou dénombrable (en bijec-
tion avec N).
Exemple 4.6 Comme exemples de v.a. discrètes on peut citer : le nombre de fois que "Pile"
apparaît dans 5 lancers d’une pièce (X (Ω) = {0, 1, 2, 3, 4, 5}), le nombre de lancers néces-
saires pour obtenir "Face" pour la première fois (X (Ω) = N∗ ), le nombre d’accidents surve-
nant dans une zone donnée (X (Ω) = N), etc. . .
Définition 4.7 On appelle loi de probabilité de la v.a. discrète X, la donnée des probabilités
P( X = xk ) pour toutes les valeurs xk ∈ X (Ω) prises par X.
Chapitre 4. Généralités sur les variables aléatoires 41
Remarque 4.8 La loi de probabilité d’une v.a. discrète X à valeurs dans { x1 , x2 , . . .} est bien
définie si et seulement elle vérifie les deux relations :



 ∀k ⩾ 1, P( X = xk ) ⩾ 0

(4.2)

∑

 P ( X = x k ) = 1.
k⩾1
Définition 4.9 On appelle fonction de répartition (f.r.) de la v.a. discrète X, la fonction définie
de R dans [0, 1] par :
FX ( x ) = P( X ⩽ x ). (4.3)
Proposition 4.10 La fonction de répartition F d’une v.a.r. X vérifie les propriétés suivantes :
1) ∀ x ∈ R, 0 ⩽ F ( x ) ⩽ 1.
2) F est une fonction croissante (au sens large), continue à droite en tout point x ∈ R.
O
3) lim F ( x ) = 0 et lim F ( x ) = 1.
x →−∞ x →+∞
LD
Remarque 4.11
1) L’ensemble de définition de la f.r. est R et non X (Ω).
A
2) En particulier, pour une v.a. discrète, la fonction de répartition est une fonction en escalier,
constante par morceaux et continue à droite.
ER
La proposition suivante est très utile pour calculer la fonction de répartition d’une v.a.
discrète.
.G
Proposition 4.12 Soit X une variable aléatoire discrète prenant un ensemble fini de valeurs { x1 , . . . , xn }
avec probabilités respectives p1 , . . ., pn telles que
C
n
∑ pi = 1.
I.
i =1
La fonction de répartition de X est obtenue par la formule :



 0 si x < x1




 p 1 si x1 ⩽ x < x2



 p1 + p2 si x2 ⩽ x < x3

 . . .

 .. .. ..



 i

F(x) = ∑ pj si x i ⩽ x < x i +1 (4.4)

 j = 1
 .
 .. ..

 ..

 . .

 n −1





 ∑ pj si x n −1 ⩽ x < x n

 j =1

 1 si x⩾x . n
Application 4.13 On lance trois fois une pièce parfaitement équilibrée et on désigne par X
le nombre de fois que "Pile" apparaît. Déterminer la loi de probabilité et la f.r. de X.
4.2.2 Variables aléatoires continues
Définition 4.14 Une v.a. X est dite absolument continue (ou à densité) s’il existe une fonction
f définie sur R, positive, continue sauf peut-être en un nombre fini de points, telle que
Z +∞
f ( x ) dx = 1 (4.5)
−∞
et pour tout intervalle B ⊂ R, on a :

Z
P( X ∈ B ) = f ( x ) dx. (4.6)
B
La fonction f est appelée la densité de la loi de X.
Exemple 4.15 Comme exemples de v.a. continues on peut citer : la durée de vie d’un té-
léphone portable (X (Ω) = R∗+ ), le temps passé dans une file d’attente devant un guichet
(X (Ω) = R∗+ ), le poids d’un individu (X (Ω) = R∗+ ), la température (X (Ω) = R), etc. . .
Proposition 4.16 Soit X une v.a. continue de densité f . Alors :

1) La f.r. de X est définie par :
Z x
∀ x ∈ R, F(x) = f (t) dt. (4.7)
−∞
2) La densité de probabilité est la dérivée de la f.r. c’est-à-dire F ′ ( x ) = f ( x ) en tout point x où f est

continue.
3) Pour tous réels a et b tels que a ⩽ b, on a :
Z b
P( a < X ⩽ b ) = F ( b ) − F ( a ) = f ( x ) dx. (4.8)
a
4) La probabilité d’un point est toujours nulle : ∀ x ∈ R, P( X = x ) = 0.
Définition 4.17 (Quantiles) Soit X une v.a. à densité dont la fonction de répartition est no-
tée F. Pour tout α ∈ ]0, 1[, on appelle quantile d’ordre α, le réel qα tel que
F (qα ) = α ou encore P( X ⩽ qα ) = α. (4.9)
La fonction quantile est l’inverse de la fonction de répartition.

Application 4.18 Soit f la fonction définie de R dans R par :

(
1 1/2 si x ∈ [1, 3]
f ( x ) = 1[1,3] ( x ) =
2 0 sinon.
1) Vérifier que f est bien une densité de probabilité.

2) Soit X la v.a. dont f est la densité de probabilité. Déterminer la f.r. F de X et la représenter.
3) Calculer P(2 ⩽ X ⩽ 3) et P( X > 2).
4) Déterminer le quantile d’ordre 0.75 de la loi de X.
4.3 M OMENTS D ’ UNE VARIABLE ALÉATOIRE

Les moments d’une variable aléatoire sont des caractéristiques numériques qui donnent
des renseignements sur la loi de cette variable aléatoire (sans pour autant la déterminer
complètement). Les plus couramment utilisés sont l’espérance mathématique (ou moyenne)
O
et la variance. LD
4.3.1 Espérance mathématique
A
Définition 4.19 Soient (Ω, A, P) un espace probabilisé et X une v.a. réelle définie sur Ω.
ER
L’espérance mathématique (ou tout simplement espérance) ou encore moyenne de X, si elle

existe, est notée E( X ) et définie comme suit :
1) Si X est discrète et prend les valeurs x1 , x2 , . . . avec probabilités respectives p1 , p2 , . . .,
.G
E( X ) = ∑ xk pk (4.10)
k⩾1
C
2) Si X est continue de densité f ,

I.
Z +∞
E( X ) = x f ( x ) dx. (4.11)
−∞
Définition 4.20 Une v.a.r. X est dite centrée si E( X ) = 0.
Proposition 4.21
1) L’espérance d’une v.a. réelle est une constante réelle.
2) L’espérance mathématique est linéaire c’est-à-dire, si a désigne une constante réelle et si X,
X1 , . . . , Xn désignent des v.a., on a :
(a) E( X + a) = E( X ) + a ;
(b) E( aX ) = aE( X ) ;
(c) E( X1 + · · · + Xn ) = E( X1 ) + · · · + E( Xn ).
3) L’espérance conserve le signe et l’ordre c’est-à-dire, si X et Y sont des variables aléatoires, alors
(a) si X ⩾ 0, alors E( X ) ⩾ 0 ;
(b) si X ⩽ Y, alors E( X ) ⩽ E(Y ).
Dans la pratique, il arrive qu’on ait besoin de calculer E(h( X )) où h( X ) est donnée en
fonction de X. Le résultat suivant permet de résoudre un tel problème.
Théorème 4.22 Soit X une variable aléatoire réelle définie sur un espace probabilisé (Ω, A, P).
Alors pour toute fonction h : R −→ R, l’espérance mathématique de h( X ) = h ◦ X, si elle existe,
est donnée par la règle suivante :
1) Si X est discrète et prend les valeurs x1 , x2 , . . . avec probabilités respectives p1 , p2 , . . .,
E(h( X )) = ∑ h( xk ) pk (4.12)
k⩾1

Z +∞
E(h( X )) = h( x ) f ( x ) dx. (4.13)
−∞
Exemple 4.23
1) Si X est discrète et prend les valeurs x1 , x2 , . . . , xn avec probabilités respectives p1 , p2 , . . .,
pn ,
n
E( X 2 ) = ∑ ( x k )2 p k (4.14)
k =1

Z +∞
E( X 2 ) = x2 f ( x ) dx. (4.15)
−∞
4.3.2 Variance
Définition 4.24 Soit X une v.a. telle que E( X 2 ) existe. La variance de X est définie par :

Var( X ) = E ( X − E( X ))2 (4.16)
p
et le réel positif σ( X ) = Var( X ) est appelé écart-type de X.
Dans la pratique, on utilise plutôt le théorème suivant :
Théorème 4.25 (König-Huygens) Soit X une v.a.r. Si Var( X ) existe, alors
Var( X ) = E( X 2 ) − (E( X ))2 . (4.17)
Proposition 4.26 Soit X une v.a.r telle que Var( X ) existe. Alors :
1) Var( X ) ⩾ 0.
2) Si a et b sont des constantes alors Var( aX + b) = a2 Var( X ).
Remarque 4.27 La variance peut-être utilisée comme un indicateur de dispersion. Plus elle
est élevée, plus les valeurs sont dispersées autour de la valeur moyenne.
Application 4.28 Reprendre les exemples 4.13 et 4.18 et calculer E( X ) et Var( X ).
O
LD
A
ER
.G
C
I.
4.4 E XERCICES
Exercice 4.1 On lance simultanément deux dés bien équilibrés dont les faces sont numéro-
tées de 1 à 6. On note X la valeur absolue de la différence des nombres portés sur les faces
supérieures.
1) Quelle est la loi de probabilité de X ?
2) Calculer E( X ) et Var( X ).
Exercice 4.2 On lance simultanément deux dés bien équilibrés dont les faces sont numéro-
tées de 1 à 6. On note X le maximum des numéros obtenus. Déterminer la loi de probabilité
de X.
Exercice 4.3 Une urne contient 3 jetons blancs (1 carré et 2 ronds) et 4 jetons noirs (3 carrés
et 1 rond). On tire au hasard et simultanément 3 jetons de l’urne. On appelle X la v.a.r égale
au nombre de jetons blancs obtenus lors d’un tirage. Loi de X et E( X ) ?
Exercice 4.4 Dans un rayon de magasin, il y a deux produits A et B (par exemple une table
et une chaise). La probabilité pour qu’un client achète le produit A est 0.3. La probabilité
pour qu’il achète le produit B quand il a acheté le produit A est 0.8 et la probabilité qu’il
achète le produit B quand il n’a pas acheté le produit A est 0.1. Les produits A et B sont
respectivement vendus à 10 000 F et 4 000 F. La dépense du client est une v.a. X. Déterminer
la loi de X puis calculer E( X ) et Var( X ).
Exercice 4.5 Soit X une variable aléatoire (v.a.) dont la loi de probabilité est donnée par le
tableau suivant :
xi −2 −1 1 2 3
P( X = x i ) 0.6 α 0.1 0.05 0.05
1) Déterminer la valeur de α.
2) Calculez l’espérance mathématique, la variance et l’écart-type de cette distribution.
3) Soit Y = 2X − 1. Déterminer la loi de Y puis calculer son espérance et sa variance par
deux méthodes différentes.
Exercice 4.6 Soit X une v.a.r prenant les valeurs −4, −2, 0, 2 et 4 avec les mêmes probabi-
lités. Déterminer la loi de | X | et ses caractéristiques numériques (espérance mathématique,
variance et écart-type).
Exercice 4.7 On considère un dé cubique truqué dont les faces sont numérotés de 1 à 6 et on
note X la variable aléatoire donnée par le numéro de la face supérieure du dé. On suppose
que le dé est truqué de sorte que la probabilité d’obtenir une face est proportionnelle au
numéro inscrit sur cette face c’est-à-dire qu’il existe un réel a tel que P( X = k ) = ka pour
tout k ∈ {1, . . . , 6}.
1) Déterminer la loi de X et calculer son espérance mathématique.
2) On pose Y = 1/X. Déterminer la loi de Y et calculer son espérance mathématique. Com-

parer E(1/X ) et 1/E( X ). Que pouvez-vous en conclure ?
Exercice 4.8 Dans une loterie, il y a 100 billets de 500 F et 2 lots : l’un de 5 000 F et l’autre
de 10 000 F. Les numéros des deux billets gagnants sont tirés au sort indépendamment l’un
de l’autre (le même billet peut donc gagner les deux lots). La somme d’argent gagnée (ou
perdue) par une personne qui achète un seul billet est une v.a. X. On représentera les pertes
par des nombres négatifs : par exemple si la personne ne gagne aucun lot, elle perd 500 F,
on aura alors X = −500. Déterminer la loi de X et calculer E( X ).
Exercice 4.9 Une urne contient une boule qui porte le numéro 0, deux qui portent le numéro
1, trois qui portent le numéro 2 et quatre qui portent le numéro 3. On extrait simultanément
deux boules de cette urne et on désigne par X la somme des numéros obtenus.
1) Déterminer la loi de X.
2) Calculer son espérance et sa variance.
O
Exercice 4.10 Soit f la fonction de R vers R définie pour tout x ∈ R par :
(
LD
kx si x ∈ [0, 3]
f (x) =
0 sinon.
A
1) Déterminer k pour que f soit la densité de probabilité d’une variable aléatoire X.

ER
2) Déterminer la fonction de répartition de X.

3) Calculer P( X > 1), P( X < 2) et P(1 < X < 2).
.G
4) Calculer l’espérance et la variance de X.

5) Déterminer le quantile d’ordre 0.25 de la loi de X.
C
Exercice 4.11 Soit f la fonction définie sur R par

(
I.
Kx (1 − x ) si 0 ⩽ x ⩽ 1
f (x) =
0 sinon
1) Déterminer K pour que f soit une densité de probabilité.

2) Soit X la v.a.r. dont la densité de probabilité est f . Calculer E( X ) et Var( X ).
3) Déterminer la fonction de répartition F ( x ) de X.
4) Calculer : P( X ⩽ 12 ) et P( 41 ⩽ X ⩽ 12 ).
C HAPITRE 5
L OIS DISCRÈTES ET CONTINUES USUELLES
Résumé – Ce chapitre présente les lois de probabilité discrètes et continues souvent utili-
sées dans la pratique. L’objectif est de savoir faire des calculs en utilisant les lois de proba-
bilité usuelles.
Sommaire
5.1 Lois discrètes usuelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
O
5.1.1 Loi uniforme discrète . . . . . . . . . . . . . . . . . . . . . . . . . .
LD 49
5.1.2 Loi de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.1.3 Loi binomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.1.4 Loi géométrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
A
5.1.5 Loi de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

ER
5.1.6 Loi hypergéométrique . . . . . . . . . . . . . . . . . . . . . . . . . . 52

5.2 Lois continues usuelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.2.1 Loi uniforme continue U [ a, b] . . . . . . . . . . . . . . . . . . . . . . 53
.G
5.2.2 Loi exponentielle E (λ) . . . . . . . . . . . . . . . . . . . . . . . . . . 54

5.2.3 Loi normale N (m, σ ) . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
C
5.3 Approximations usuelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

5.3.1 Approximation binomiale de la loi hypergéométrique . . . . . . . . 59
I.
5.3.2 Approximation de la loi binomiale par une loi de Poisson . . . . . 59

5.3.3 Approximation de la loi binomiale par une loi normale . . . . . . . 60
5.3.4 Approximation de la loi de Poisson par une loi normale . . . . . . 60
5.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Dans tout le chapitre, on utilise le symbole ⇝ pour exprimer le fait qu’une v.a. suive
une certaine loi de probabilité.
5.1 L OIS DISCRÈTES USUELLES

5.1.1 Loi uniforme discrète
Pour tout n ∈ N∗ , on note [[1, n]] = {1, . . . , n}.
49
Définition 5.1 Soit n ∈ N∗ . Une variable aléatoire X suit une loi uniforme discrète sur
[[1, n]] si X prend ses valeurs dans l’ensemble [[1, n]] = {1, . . . , n} et si
1
∀k ∈ {1, . . . , n}, P( X = k ) = . (5.1)
n
L’espérance mathématique et la variance sont données par la proposition suivante :
Proposition 5.2 Si X suit une loi uniforme discrète sur [1, n], alors
n+1 n2 − 1
E( X ) = et Var( X ) = . (5.2)
2 12
Remarque 5.3 La loi uniforme discrète intervient dans de nombreux domaines comme les
jeux de pile ou face ou les jeux de dés (avec une pièce ou un dé parfaitement équilibré(e)),
les jeux de cartes, etc. . .
5.1.2 Loi de Bernoulli
Définition 5.4 Soit p ∈ [0, 1]. Une variable aléatoire X suit une loi de Bernoulli de para-
mètre p et on note X ⇝ B(1, p) si la v.a. X ne peut prendre que deux valeurs 1 et 0 avec
probabilités respectives p et q = 1 − p c’est-à-dire X (Ω) = {0, 1} et
P( X = 1) = p etP( X = 0) = q = 1 − p. (5.3)
L’espérance mathématique et la variance sont données par la proposition suivante.
Proposition 5.5 Si X ⇝ B(1, p), alors
E( X ) = p et Var( X ) = p(1 − p) = pq. (5.4)
Remarque 5.6 La loi de Bernoulli B(1, p) est souvent utilisée pour modéliser une épreuve
de Bernoulli c’est-à-dire une expérience aléatoire dont le résultat ne peut prendre que deux
valeurs appelées, par convention, succès et échec. Dans ce cas, la v.a. X associée prend la
valeur 1 pour le succès et la valeur 0 pour l’échec avec probabilités respectives p et q = 1 − p.
5.1.3 Loi binomiale

Considérons une expérience aléatoire n’ayant que deux résultats possibles : le succès
(avec probabilité p ∈ [0, 1]) et l’échec (avec probabilité q = 1 − p). Répétons cette expérience
n fois de façon indépendante et désignons par X le nombre de succès obtenus au cours des
n répétitions de l’expérience. Il est clair que la v.a. X prend ses valeurs dans l’ensemble
X (Ω) = {0, 1, . . . , n}. Par définition, la v.a. X suit une loi binomiale de paramètres n et
p ∈ [0, 1], notée B(n, p) et on a :
∀k ∈ {0, 1, . . . , n}, P( X = k ) = Cnk pk (1 − p)n−k (5.5)

Chapitre 5. Lois discrètes et continues usuelles 51
où
n!
Cnk = .
k!(n − k )!
La quantité P( X = k ) représente la probabilité d’obtenir k succès au cours des n répétitions.
Application 5.7 Vous avez un devoir de Mathématiques à rendre et vous contactez 10 de

vos amis les plus sincères pour vous aider. Chacun, indépendamment des autres a une
probabilité de 0.2 d’accepter de vous aider. A la fin de tous vos 10 coups de fil, la v.a. X du
nombre total d’amis qui acceptent vous aider suit une loi binomiale B(10, 0.2). Quel est la
probabilité que vous :
1) ne trouviez aucun ami pour vous aider ?

2) trouviez au moins un ami pour vous aider ?
▶▶▶ Réponse : On pourra vérifier que le premier résultat cherché est 0.107. Le second s’en
O
déduit aisément à l’aide des opérations sur les événements.
LD
A
Proposition 5.8 Si X ⇝ B(n, p), alors

ER
E( X ) = np et Var( X ) = np(1 − p) = npq. (5.6)

G
5.1.4 Loi géométrique

C.
Considérons une expérience aléatoire n’ayant que deux résultats possibles : le succès
(avec probabilité p ∈ [0, 1]) et l’échec (avec probabilité q = 1 − p). Répétons cette expé-
I.
rience plusieurs fois de façon indépendante et désignons par X le nombre de répétitions

nécessaires pour obtenir le premier succès. Il est évident que la v.a. X prend ses valeurs
dans l’ensemble X (Ω) = N∗ . Par définition, la v.a. X suit une loi géométrique de paramètre
p ∈ [0, 1], notée G( p) et on a :
∀ k ∈ N∗ , P( X = k ) = (1 − p)k−1 p. (5.7)
Cette quantité représente la probabilité d’obtenir k − 1 échecs avant d’obtenir le succès à la

kème répétition.
Proposition 5.9 Si X suit une loi G( p), alors
1 1− p
E( X ) = et Var( X ) = . (5.8)
p p2
5.1.5 Loi de Poisson
Définition 5.10 La loi de Poisson de paramètre λ > 0, notée P (λ), est la loi d’une v.a.
discrète prenant ses valeurs dans N avec les probabilités :
e− λ λ k
∀k ∈ N, P( X = k ) = . (5.9)
k!
Proposition 5.11 Si X ⇝ P (λ), alors
E( X ) = Var( X ) = λ. (5.10)
Remarque 5.12 La loi de Poisson est utilisée pour décrire les « événements rares » comme
le nombre d’appels reçus par un standard téléphonique pendant une période donnée, le
nombre de suicides par an dans un pays donné, le nombre de pièces défectueuses dans une
livraison importante (la production étant de bonne qualité), le nombre d’accidents dans un
atelier, etc. . ..
5.1.6 Loi hypergéométrique

On considère une population de N individus dont M vérifient une certaine propriété.
On choisit n individus au hasard dans cette population et on s’intéresse au nombre X d’indi-
vidus dans l’échantillon vérifiant la propriété. La probabilité d’avoir exactement k individus
vérifiant la propriété est :
k C n−k
CM N−M
P( X = k ) = n . (5.11)
CN
Les valeurs extrêmes de k sont :
kmin = max(0, n − N + M) et kmax = min(n, M ).
La variable aléatoire X ainsi définie suit une loi hypergéométrique dépendant de trois para-
mètres N, n et p notée H( N, n, p), où p = M/N désigne la proportion d’individus vérifiant
la propriété dans la population entière.
Proposition 5.13 Si X suit une loi hypergéométrique H( N, n, p), alors
N−n
E( X ) = np et Var( X ) = np(1 − p). (5.12)
N−1
5.2 L OIS CONTINUES USUELLES

5.2.1 Loi uniforme continue U [ a, b]
Définition 5.14 Soient a et b deux réels tels que a < b. Une variable aléatoire X à valeurs
dans [ a, b] suit une loi uniforme continue sur [ a, b], notée U [ a, b], si X est une v.a. continue
et admet pour densité de probabilité, la fonction (voir Figure 5.1) définie par :

1  1 si x ∈ [ a, b]
f (x) = 1 (x) = b − a (5.13)
b − a [a,b] 0 sinon.
f (x)
O
1/(b − a)
LD
A
0 a b x
ER
F IGURE 5.1 – Densité de la loi uniforme U [ a, b].

G
Remarque 5.15 La loi uniforme définie par sa densité

C.
(
1 si x ∈ [0, 1]
f (x) = (5.14)
I.
0 sinon.
est appelée loi uniforme standard.
La loi uniforme sur [0, 1] et la loi uniforme sur [ a, b] sont liées par les relations suivantes.
Proposition 5.16
X−a
1) Si X ⇝ U [ a, b], alors U = b− a ⇝ U [0, 1].
2) Si U ⇝ U [0, 1], alors X = (b − a)U + a ⇝ U [ a, b].
Proposition 5.17 Si X est une variable aléatoire de loi uniforme U [ a, b], alors
a+b ( b − a )2
E( X ) = et Var( X ) = . (5.15)
2 12
La fonction de répartition (f.r.) de la loi uniforme U [ a, b] est donnée par la proposition

suivante.
Proposition 5.18 Si X ⇝ U [ a, b], alors la f.r. est définie par :


 0 si x ⩽ a
x − a
F(x) = si x ∈ [ a, b] (5.16)

 b−a

1 si x ⩾ b.
5.2.2 Loi exponentielle E (λ)
Définition 5.19 Une variable aléatoire X à valeurs dans [0, +∞[ suit une loi exponentielle
de paramètre λ > 0, notée E (λ), si X est une v.a. continue et admet pour densité de proba-
bilité la fonction (voir Figure 5.2) :
(
λe−λx si x ⩾ 0
f ( x ) = λe−λx 1R+ ( x ) = (5.17)
0 si x < 0.
f (x)
0 1 2 3 4 5 x
F IGURE 5.2 – Densité de la loi exponentielle E (λ) pour λ = 3.

Proposition 5.20 Si X est une variable aléatoire de loi exponentielle E (λ), alors
1 1
E( X ) = et Var( X ) = . (5.18)
λ λ2
La f.r. de la loi exponentielle est donnée par la proposition suivante.
Proposition 5.21 Si X ⇝ E (λ), alors la f.r. est définie par :
(
1 − e−λx si x ⩾ 0
F(x) = (5.19)
0 si x < 0.
5.2.3 Loi normale N (m, σ )

5.2.3.1 Définition et propriétés
Définition 5.22 Une v.a.r. X, prenant ses valeurs dans R, suit la loi normale (ou loi de
Gauss) de paramètres m ∈ R et σ > 0, notée N (m, σ), si sa densité de probabilité est
donnée par :
1 − ( x −m)
2
f (x) = √ e 2σ2 . (5.20)
σ 2π
Définition 5.23 La loi N (0, 1) est appelée loi normale centrée réduite ou loi normale stan-
dard. Sa densité (voir Figure 5.3) est souvent notée φ :
1 2
φ( x ) = √ e− x /2 . (5.21)
2π
O
φ( x )
LD
A
Φ(−z) = P( X ⩽ −z)
= 1 − Φ(z) Φ(−z)
ER
.G
C
−3 −2 −1 − z 0 z 1 2 3 x
I.
F IGURE 5.3 – Densité de la loi N (0, 1). La zone coloriée correspond à Φ(−z).
Remarque 5.24 La courbe représentant la densité de probabilité d’une variable normale

(ou gaussienne) N (m, σ) a un axe de symétrie vertical pour x = m et du fait de sa forme,
elle est souvent appelée « courbe en cloche ».

Proposition 5.25 Si X ⇝ N (m, σ), alors E( X ) = m et Var( X ) = σ2 .
5.2.3.2 Fonction de répartition de la loi N (m, σ)
Définition 5.26 La fonction de répartition (f.r.) de la loi N (m, σ) est définie par :
Z x
1 − (t−m2)
2
F ( x ) = P( X ⩽ x ) = √ e 2σ dt
σ 2π −∞
pour tout x ∈ R. En particulier, la f.r. de la loi N (0, 1), généralement notée Φ, est définie
par Z z
1 t2
Φ(z) = √ e− 2 dt.
2π −∞
pour tout z ∈ R.
La f.r. de la loi N (m, σ) n’a pas d’expression analytique exacte. Pour contourner ce pro-
blème, on utilise la proposition suivante qui montre que les valeurs de la f.r. d’une loi nor-
male quelconque peuvent être obtenues à partir de celles de la loi normale centrée réduite.
Proposition 5.27 Soit X une v.a. suivant la loi N (m, σ). Alors, la v.a. Z définie par
X−m
Z= (5.22)
σ
et appelée variable centrée réduite associée à X, suit la loi N (0, 1).
Cette propriété permet de ramener tous les calculs liés à la fonction de répartition d’une
loi normale quelconque à celle de la loi normale centrée réduite. En effet, supposons que X
suive une loi normale N (m, σ) et que nous voulions calculer F ( x ) = P( X < x ). Soit
X−m
Z=
σ
la variable centrée réduite associée à X. On a :

X−m x−m x−m x−m
P( X < x ) = P < =P Z< =Φ . (5.23)
σ σ σ σ
Il ne reste donc plus qu’à savoir calculer la f.r. de la loi N (0, 1). Dans ce cas, on ne
dispose pas de formule analytique exacte et l’on a plutôt recours à une table statistique
(voir page 110).
5.2.3.3 Fonction de répartition de la loi N (0, 1)

La table de la fonction de répartition de la loi N (0, 1) est donnée dans l’annexe A (voir
page 110).
Exemple 5.28 Pour lire Φ(1.96), on fait la décomposition 1.96 = 1.90 + 0.06. On repère,
dans la première colonne, la ligne où se trouve 1.90 et, dans la première ligne, la colonne où
se trouve 0.06 puis on lit la valeur se trouvant à l’intersection de la ligne correspondant à
1.90 et de la colonne correspondant à 0.06. On trouve Φ(1.96) = 0.975.
On peut remarquer que seules les valeurs Φ(z) = P( X < z) avec u positif y figurent.
On montre que la fonction de répartition de la loi N (0, 1) vérifie la proposition suivante.
Proposition 5.29 La f.r. de la loi N (0, 1) vérifie la propriété suivante :
∀z ∈ R, Φ(−z) = 1 − Φ(z) (5.24)
et en particulier Φ(0) = 1/2.

En résumé,
• pour z ⩾ 0, la valeur de Φ(z) est donnée par la table.
• pour z < 0, on a −z > 0 et Φ(z) = 1 − Φ(−z).
5.2.3.4 Calcul de P( a < X < b) pour la loi N (0, 1)

Pour tous a et b ∈ R tels que a < b, on a :
P( X < b ) = Φ ( b ) (5.25)
P( X > a ) = 1 − Φ ( a ) (5.26)
P( a < X < b ) = Φ ( b ) − Φ ( a ). (5.27)
5.2.3.5 Calcul de P( a < X < b) pour la loi N (m, σ)

Pour une v.a. X ⇝ N (m, σ), on sait que
X−m
Z= ⇝ N (0, 1).
O
σ
Pour tous a et b ∈ R tels que a ⩽ b, on a :
LD

X−m b−m
P( X < b ) = P <
σ σ

A
b−m
=P Z<
σ
ER

b−m
=Φ ,
σ
.G

X−m a−m
P( X > a ) = P >
σ σ
C

a−m
=P Z>
σ
I.

a−m
= 1−Φ
σ
et

a−m X−m b−m
P( a < X < b ) = P < <
σ σ σ

a−m b−m
=P <Z<
σ σ

b−m a−m
=Φ −Φ .
σ σ
Exemple 5.30 Soit X une variable suivant la loi normale N (3, 2). Calculons les probabilités
suivantes : P( X < 4), P( X < −1), P( X > 1), P(−3 < X < 4). On sait que
X−3
Z= ⇝ N (0, 1).
2
On a :

X−3 4−3
P( X < 4) = P <
2 2
= P( Z < 1/2)
= Φ(0.5)
≃ 0.6915.

X−3 −1 − 3
P( X < −1) = P <
2 2
= P( Z < −2)
= Φ(−2)
= 1 − Φ (2)
≃ 0.0227.

X−3 1−3
P( X > 1) = P >
2 2
= P( Z > −1)
= 1 − P( Z < −1)
= 1 − (1 − Φ(1))
= Φ (1)
≃ 0.8413.

−3 − 3 X−3 4−3
P(−3 < X < 4) = P < <
2 2 2
= P(−3 < Z < 1/2)
= Φ(1/2) − Φ(−3)
= Φ(1/2) − 1 + Φ(3)
≃ 0.6901.
5.2.3.6 Quantiles
Les quantiles de la loi normale N (0, 1) jouent un grand rôle en probabilité et en statis-
tique (tests d’hypothèses, construction d’intervalles de confiance, . . .).
On rappelle ci-après la définition des quantiles.
Définition 5.31 Soit X une v.a. à densité dont la fonction de répartition est notée F. Pour
tout α ∈ ]0, 1[, on appelle quantile d’ordre α, le réel qα tel que
F (qα ) = α ou encore P( X ⩽ qα ) = α.
La fonction quantile est l’inverse de la fonction de répartition.

Les quantiles usuels de la loi normale centrée réduite sont donnés sous la forme d’une
table disponible en annexe (voir page 110). Ils vérifient la propriété fondamentale suivante :
Proposition 5.32 Soit α ∈ ]0, 1[. Notons zα le quantile d’ordre α de la loi normale centrée réduite.
Alors, on a :
z 1− α = − z α .
Exemple 5.33 On a : z0.975 = 1.96 et z0.025 = z1−0.975 = −z0.975 = −1.96.
5.3 A PPROXIMATIONS USUELLES

5.3.1 Approximation binomiale de la loi hypergéométrique
Quand N tend vers l’infini, on peut approximer la loi hypergéométrique H( N, n, p) par
la loi binomiale B(n, p). Dans la pratique, ce résultat s’applique dès que n/N < 10% c’est-
à-dire dès que la population est 10 fois plus grande que l’échantillon. C’est pour cela qu’en
statistique, lorsque la taille N de la population est très grande, on peut assimiler un tirage
O
sans remise (loi hypergéométrique) à une tirage avec remise (loi binomiale).
LD
5.3.2 Approximation de la loi binomiale par une loi de Poisson
Quand n → +∞ et p → 0, on peut approximer la loi binomiale B(n, p) par une loi de
A
Poisson P (np). En pratique, cela est possible pour des valeurs très faibles de la probabilité
p (p < 0.1) et des valeurs très grandes de n (n > 50). Une illustration en est donnée par la
ER
figure 5.4.
.G
0.12
C
0.10
I.
0.08
P(X=k)
0.06
0.04
0.02
0.00
0 5 10 15 20 25 30 35
F IGURE 5.4 – Approximation de la loi B(400; 0, 03) (en bleu) par la loi P (12) (en rouge). Tous les
bâtons ne sont pas affichés (pour la loi de Poisson, il y en a une infinité). On se limite aux valeurs de
k pour lesquelles la probabilité est assez éloignée de zéro pour être visible sur le graphique.
5.3.3 Approximation de la loi binomiale par une loi normale

Lorsque n → +∞, on peut approximer la loi binomiale B(n, p) par la loi normale
√
N (np, npq) où q = 1 − p. En pratique, les deux conditions généralement requises sont
np > 5 et n(1 − p) > 5.
Comme il s’agit de l’approximation d’une loi discrète par une loi continue, on procède
à ce que l’on appelle correction de continuité de la façon suivante : Si X ∼ B(n, p) et si
k ∈ {1, . . . , n} alors
P( X = k) ≃ P(k − 0.5 < X < k + 0.5)

k − 0.5 − np k + 0.5 − np
≃P √ <Z< √
npq npq

k + 0.5 − np k − 0.5 − np
≃Φ √ −Φ √ (5.28)
npq npq
où Z est la v.a. centrée réduite de loi N (0, 1) associée à X et Φ la fonction de répartition de

la loi N (0, 1) ; de même,
P( a ⩽ X ⩽ b) ≃ P( a − 0.5 ⩽ X ⩽ b + 0.5)

a − 0.5 − np b + 0.5 − np
≃P √ ⩽U⩽ √
npq npq

b + 0.5 − np a − 0.5 − np
≃Φ √ −Φ √ . (5.29)
npq npq
Si on n’appliquait pas la correction de continuité, on trouverait systématiquement P( X =

k ) = 0 puisque la loi normale est une loi continue.
Exemple 5.34 Pour X ∼ B(100, 0.3), np = 30 et nq = 70, la valeur exacte de P( X = 30) est
30
P( X = 30) = C100 0.330 0.770 ≈ 0.08678.
√ √
La formule d’approximation avec une loi N (np, npq) = N (30, 21) donne le résultat :

30 + 0.5 − 30 30 − 0.5 − 30
P( X = 30) ≈ Φ √ −Φ √ ≈ 0.08688.
21 21
L’erreur d’approximation est très faible.
5.3.4 Approximation de la loi de Poisson par une loi normale

√
Lorsque λ → +∞, on peut approximer la loi de Poisson P (λ) par la loi normale N (λ, λ).
En pratique, cette approximation est satisfaisante dès que λ > 18. Ici aussi, comme il s’agit
d’une approximation d’une loi discrète par une loi continue, il faudra appliquer la correc-
tion de continuité.
5.4 E XERCICES
Exercice 5.1 Vous vous livrez chaque matin (du lundi au vendredi inclus) au petit jeu sui-
vant : ayant jeté une pièce de monnaie, vous vous rendez en cours si le résultat obtenu est
« face » ; dans le cas contraire, vous restez au lit. Soit X le nombre de jours où vous avez
« gagné » le droit au repos.
1) Quelle est la loi de X ? Justifiez votre réponse.
2) Calculer E( X ) et Var( X ).
Exercice 5.2 On jette 10 pièces de monnaies truquées de telle sorte que pour chacune d’elles,
la probabilité d’obtenir "pile" soit 0.3. Soit X la v.a. égale au nombre de "piles" obtenus au
cours de ce lancer.
1) Loi de X, E( X ) et Var( X ) ?
2) Probabilité d’obtenir 3 "piles" ? moins de 3 "piles" ?
3) Probabilité que l’on ait obtenu plus de 3 piles sachant que l’on a obtenu au plus 5 "piles" ?
O
Exercice 5.3 On considère deux types d’avions A et B ayant respectivement 4 et 2 moteurs.
LD
Les moteurs sont supposés indépendants les uns des autres, et ils ont une même probabilité
p (0 < p < 1) de tomber en panne. Chaque avion arrive à destination si moins de la moitié
de ses moteurs tombe en panne (c’est-à-dire que l’avion A arrive à destination si au plus
A
un des moteurs tombe en panne et l’avion B arrive à destination si aucun des moteurs ne
ER
tombe en panne). Soient X et Y respectivement le nombre de moteurs tombant en panne

pour A et B.
.G
1) Quelles sont les lois respectives de X et Y ?

2) Déterminer en fonction de p les probabilités p A (resp. p B ) pour que l’avion A (resp. B)
arrive à destination.
C
3) Quel avion choisirez-vous ? (on discutera en fonction de la valeur de p).

I.
Exercice 5.4 Le nombre d’ordinateurs vendus chaque jour dans un magasin spécialisé suit
une loi de Poisson de paramètre 4. Calculer la probabilité que dans une journée :
1) on ne vende aucun ordinateur,
2) on vende 4 ordinateurs,
3) on vende au moins un ordinateur,
4) on vende au plus 3 ordinateurs,
5) le nombre d’ordinateurs vendus est compris entre 2 et 6.
Exercice 5.5 Soit X une v.a. de loi exponentielle E (λ) avec λ > 0.
1) Rappeler l’expression de la fonction de répartition de X.
2) Vérifier que P( X > h + t| X > h) = P( X > t). On dit que la loi exponentielle est « sans
mémoire ».
3) On suppose que la durée de vie d’une clé USB suit une loi exponentielle de paramètre
λ = 1/24. L’unité de temps est le mois. Quelle est la probabilité que :
(a) la clé USB fonctionne au moins 8 mois ?
(b) la clé fonctionne encore 4 mois ou plus sachant qu’elle fonctionne toujours au bout
de 8 mois ?
Exercice 5.6
1) Quelle est la probabilité d’obtenir un double (deux mêmes nombres) lorsqu’on lance une
fois une paire de dés ?
2) On lance de façon répétée une paire de dés jusqu’à la première obtention d’un double.
Soit X la variable aléatoire égale au nombre de lancers ainsi réalisés. Donner les valeurs
de P( X = 1), P( X = 2) et plus généralement P( X = k ) où k ⩾ 1 est un entier quel-
conque. Comment s’appelle la loi de X ?
3) Soit n ⩾ 1 un nombre entier naturel. Calculer la probabilité de n’obtenir aucun double
lors des n premiers lancers. En déduire P( X > n).
4) Pour k > n, vérifier que P( X = k | X > n) = P( X = k − n). En donner une interprétation.
Exercice 5.7 Soit X une v.a. suivant la loi normale centrée réduite. Calculer P(−2 < X <
−1), P(| X | < 3), P( X < 2| X > 1.65).
Exercice 5.8 Soit X une v.a.r suivant la loi N (8, 4). Calculer P( X < 7.5), P( X > 8.5),
P(6.5 < X < 10) et P( X > 6 | X > 5).
Exercice 5.9 On suppose que la taille X des hommes suit une loi normale d’espérance 1.75
m et d’écart-type 0.07 m. On mesure la taille chez un individu.
1) Calculer la probabilité que sa taille soit
(a) inférieure à 1.54 m
(b) supérieure à 1.85 m
(c) comprise entre 1.54 m et 1.85 m.
2) On mesure la taille chez 2000 individus. On assimile la situation à un tirage avec remise
et on désigne par X le nombre d’individus dont la taille est supérieure à 1.85 m.
(a) Quelle est la loi de X ?
(b) Donner le nombre moyen d’individus dont la taille est supérieure à 1.85m.
Exercice 5.10 Dans un pays dont la population est composée de femmes à 55%, la taille (en
mètres) des adultes de sexe masculin (resp. féminin) est distribuée selon une loi normale de
moyenne 1.78 (resp. 1.72) et d’écart-type 0.14 (resp. 0.1).
1) Quelle proportion des femmes mesure moins de 1.76m ?
2) Quelle proportion des hommes mesure moins de 1.76m ?
3) Quelle est la probabilité pour qu’une personne choisie au hasard mesure moins de 1.76m ?
4) Parmi les personnes mesurant moins de 1.76m, quelle est la proportion de femmes ?
5) Si vous choisissez une personne au hasard dans la population, quelle est la probabilité
que ce soit un homme mesurant moins de 1.76m ?
Exercice 5.11 On jette 360 fois un dé équilibré dont les faces sont numérotées de 1 à 6 et on
désigne par X le nombre d’apparitions du numéro 1.
1) Quelle est la loi exacte de X ?
2) En approximant la loi de X par une loi normale, déterminer la probabilité que le nombre
d’apparitions du numéro 1 soit compris entre 48 et 72.
O
LD
A
ER
.G
C
I.
Deuxième partie
O
Statistique descriptive
LD
A
ER
.G
C
I.
65
C HAPITRE 6
C ONCEPTS FONDAMENTAUX DE LA STATISTIQUE
Résumé – Dans ce chapitre, nous rappelons les concepts fondamentaux de la statistique.
Sommaire
6.1 Définition et champs d’application de la statistique . . . . . . . . . . . . 67
6.2 Vocabulaire de la statistique . . . . . . . . . . . . . . . . . . . . . . . . . . 67
O
6.2.1 Population, individus et échantillon . . . . . . . . . . . . . . . . . . 67
6.2.2 Caractères ou variables statistiques . . . . . . . . . . . . . . . . . . 69
LD
6.2.3 Série statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
6.3 Statistique descriptive et statistique inférentielle . . . . . . . . . . . . . . 72
A
6.1 D ÉFINITION ET CHAMPS D ’ APPLICATION DE LA STATISTIQUE

ER
Le mot « statistique » a plusieurs sens. Il peut désigner un ensemble de données (par

.G
exemple, les statistiques du chômage au Togo) ou encore l’ensemble des méthodes de col-
lecte, de traitement, d’analyse, d’interprétation et de présentation (diffusion) des données
afin de les rendre accessibles. Le mot « statistique » est aussi parfois utilisé pour désigner
C
un paramètre numérique calculé à partir des données.

I.
Les champs d’application de la statistique sont très nombreux. Partout où il y a des

données, l’on a besoin de la statistique. La science statistique intervient à toutes les étapes,
de la collecte des données jusqu’à leur analyse, leur interprétation et leur diffusion. La sta-
tistique intervient aussi bien dans les sciences expérimentales (physique, chimie, biologie,
etc. . .) qu’en informatique, en économie et en gestion, en médecine, en sociologie ou en
psychologie. La statistique est souvent à la base de décisions importantes, les décideurs ne
regardant pas les données mais plutôt les informations qui en sont extraites. Le statisticien
doit donc s’imposer une démarche rigoureuse tout en ne perdant pas de vue l’objectivité.
6.2 V OCABULAIRE DE LA STATISTIQUE

6.2.1 Population, individus et échantillon
Définition 6.1
67
• L’ensemble Ω sur lequel porte une étude statistique est appelé la population.
• Un élément ω de cette population est appelé individu ou unité statistique.
• Le nombre n d’individus composant la population à étudier est appelé effectif total
ou taille de la population.
Il faut prêter attention au fait que les termes « population » et « individu » sont em-
ployés aussi bien lorsqu’il s’agit d’êtres humains que d’objets quelconques. Il est toujours
indispensable de bien définir la population soumise à l’étude statistique.
Exemple 6.2
• Si l’on souhaite étudier l’âge moyen des employés de banque de la ville de Lomé, la
population est l’ensemble des employés de banque de Lomé et l’unité statistique est
un employé de banque de Lomé.
• Par contre, lorsque l’on souhaite étudier le nombre d’employés des banques de la
ville de Lomé, la population est l’ensemble des banques de la ville de Lomé (et non
l’ensemble des employés de banque de la ville de Lomé) et l’unité statistique est une
banque de la ville de Lomé.
Définition 6.3 On appelle échantillon toute partie (tout sous-ensemble) de la population

soumise à l’étude statistique.
Les notions de population, individus et échantillons sont illustrées par la figure 6.1.
Individu
, , ,
, , , , ,
Population , , , , ,
, , , , ,
, , ,
Un échantillon
F IGURE 6.1 – Population, individus et échantillon.
Définition 6.4
Chapitre 6. Concepts fondamentaux de la statistique 69
• Le statisticien fait des relevés sur les individus d’une population : ce sont les observa-
tions.
• Lorsque l’étude statistique consiste à faire des observations sur tous les individus
d’une population, on parle de recensement.
• Lorsque l’étude statistique consiste à faire des observations sur un échantillon de la
population, on parle de sondage.
L’utilisation d’un sondage plutôt que d’un recensement s’explique par le fait qu’un re-
censement dans une population de grande taille est très couteux en temps et en ressources
financières. Par exemple, lors de la campagne pour une élection présidentielle, il est souhai-
table pour les candidats d’avoir, sur une base journalière, une idée sur les intentions de vote
afin d’apprécier l’acceptation de leurs programmes par la population et de faire des ajuste-
ments si nécessaire. Mais il n’est pas possible d’interroger des millions de personnes en une
journée et ce, chaque jour. L’étude des méthodes de sélection d’un échantillon dit « repré-
sentatif » et de la généralisation des résultats obtenus sur ledit échantillon à la population
O
entière fait l’objet de la théorie des sondages et de la théorie de l’estimation.
LD
6.2.2 Caractères ou variables statistiques
A
Définition 6.5 Les caractéristiques ou propriétés étudiées sur les individus sont appelées
caractères ou variables. Mathématiquement, un caractère est une application χ de l’en-
ER
semble Ω (la population) dans l’ensemble C des valeurs possibles dudit caractère, qui asso-
cie à chaque individu ω de Ω la valeur χ(ω ) que prend ce caractère sur l’individu ω. Les
valeurs possibles d’un caractère sont appelées ses modalités.
.G
Remarque 6.6 Les modalités d’un caractère doivent être incompatibles (un individu ne
C
peut appartenir à deux modalités ou plus) et exhaustives (chaque individu appartient à

une modalité car tous les cas ont été prévus). Ainsi, chaque individu doit appartenir à une
I.
et une seule modalité.
Il y a deux types de caractères : quantitatif et qualitatif. La distinction entre les deux

types de caractères est très importante puisque les méthodes d’analyse diffèrent suivant la
nature du caractère étudié.
6.2.2.1 Caractères quantitatifs

Un caractère est dit quantitatif lorsque ses modalités ont des quantités numériques. Par
exemple l’âge, la taille, la température, le revenu, le nombre d’enfants d’un couple, la durée
de travail sont toutes des variables quantitatives.
Les modalités d’une variable quantitative sont parfois si nombreuses que pour des rai-
sons de commodité, elles sont regroupées en classes. Par exemple, dans l’étude de l’âge des
individus d’un pays, la variable « age » peut être définie selon des tranches d’âge exprimant
des modalités telles que 0-4 ans, 5-9 ans, 10-17 ans, etc. On distingue deux types de variables
quantitatives : les variables discrètes et les variables continues.
Une variable quantitative X est dite discrète si l’ensemble de ses modalités est au plus
dénombrable, c’est-à-dire si ses valeurs peuvent être énumérées sous la forme d’une liste
de chiffres x1 , x2 , . . .. Parmi les exemples de variables quantitatives discrètes, on peut citer :
le nombre d’enfants d’une famille, la répartition des étudiants togolais étudiant à l’étranger
dans les pays de l’UEMOA en 2022-2023, le nombre d’accidents mensuels sur les routes to-
golaises en 2022, etc. . ..
Une variable quantitative est dite continue si ces modalités ne sont pas au plus dénom-
brables c’est-à-dire qu’on ne peut pas les numéroter ou si ses modalités sont regroupées par
classes (intervalles de R). Une telle variable peut prendre toutes la valeurs dans un (plu-
sieurs) intervalle(s) de R. Parmi les exemples de variables quantitatives continues, on peut
citer : la taille d’une personne, le poids des individus d’une population, la durée de vie d’un
composant électronique, etc. . ..
Remarque 6.7 Pour une variable quantitative continue, le nombre de classes doit respecter
certains critères. Le nombre de classes à retenir dépend de la précision des mesures et de
la taille de la population étudiée. Il ne doit être ni trop grand (sinon le problème de départ
qui concerne l’abondance des données n’est pas résolu) ni trop petit (car il y aurait perte
d’informations).
6.2.2.2 Caractères qualitatifs
Une variable est dit qualitative lorsque ses modalités sont des mots ou des lettres n’ex-
primant pas de quantité. Une variable qualitative n’ayant que deux modalités est dite di-
chotomique.
On distingue deux types de variables qualitatives : les variables nominales et les va-
riables ordinales.
Une variable qualitative est dite nominale si ses modalités ne sont pas ordonnées. Par
exemple on peut citer : le sexe, la couleur des yeux, le loisir préféré des individus d’une
population, la marque de voiture, le numéro de téléphone, etc. . .
Une variable qualitative est dite ordinale si ses modalités peuvent être ordonnées. Par
exemple on peut citer : la mention à un examen ("Passable", "Assez-bien", "Bien", "Très-
bien"), la cotation attribuée par un jury (par exemple A = "Très satisfaisant", B = "Satisfai-
sant", . . .), le degré de satisfaction, etc. . .
Remarque 6.8 II arrive (par exemple pour des raisons de traitement informatique) de coder
les modalités d’une variable qualitative avec des valeurs numériques. Dans le cas de la
variable "sexe", par exemple, on pourrait noter 0 pour la catégorie « homme » et 1 pour
la catégorie « femme ». Il est important de souligner que les nombres utilisés pour de tels
Chapitre 6. Concepts fondamentaux de la statistique 71
codages sont non-quantitatifs. Le fait d’attribuer des valeurs numériques pour représenter
les diverses modalités d’une variable qualitative ne signifie pas que ces nombres possèdent
des propriétés arithmétiques. Ces codes ne servent qu’à identifier les modalités de manière
pratique. On n’imagine mal le calcul du sexe moyen dans une population.
Application 6.9 Le recensement général de la population et de l’habitat (RGPH) du Togo

en 2010 a donné les résultats suivants (voir Tableau 6.1).
TABLE 6.1 – RGPH 2010 (source : http://data.gouv.tg).
Région Maritime* Plateaux Centrale Kara Savanes

Nombre d’hommes 1 248 354 678 191 308 443 376 111 397 996
Nombre de femmes 1 351 601 696 974 309 428 393 829 430 228
Nombre d’habitants 2 599 955 1 375 165 617 871 769 940 828 224
* Lomé - Commune inclus.
O
Préciser la population étudiée, les individus, les caractères et leur nature.
LD
Application 6.10 Indiquer de quel type sont les variables présentées ci-dessous : (qualita-
A
tives nominales, qualitatives ordinales, quantitatives discrètes ou quantitatives continues).
(a) L’état-civil des habitants togolais.
ER
(b) La taille des étudiants de notre université.

(c) Le nombre de pages d’un support de cours.
.G
(d) Le nombre de ventes d’un appareil électro-ménager.

(e) Le sexe des élèves passant le BAC.
C
(f) La nationalité des élèves d’une classe.

I.
(g) Le nombre de télévisions par ménage.

(h) Le degré de qualification du personnel d’une entreprise.
(i) La couleur des yeux des étudiants.
(j) Le nombre de jours de pluie pendant le mois d’août.
6.2.3 Série statistique
Définition 6.11 Les observations d’un ou plusieurs caractères sur toute la population forment
une série statistique.
Les séries statistiques les plus élémentaires sont les séries à une variable (séries statis-
tiques univariées) et les séries à deux variables (séries statistiques bivariées).
6.3 S TATISTIQUE DESCRIPTIVE ET STATISTIQUE INFÉRENTIELLE

Les méthodes statistiques peuvent être regroupées en deux grands sous-groupes : la sta-
tistique descriptive et la statistique inférentielle :
• la statistique descriptive s’intéresse au traitement des données pour en dégager des

renseignements quantitatifs ou qualitatifs et ne s’applique que si les données ont été
collectées sur la population en entier.
• la statistique inférentielle (encore appelée statistique mathématique) a pour fonc-

tion d’aider à extrapoler, à partir d’un échantillon tiré de la population à étudier, le
comportement de la population dans son ensemble. Cette statistique utilise des mo-
dèles théoriques (lois de probabilité) et nécessite la recherche d’échantillons « repré-
sentatifs » (qui représentent le mieux possible la diversité de la population entière)
constitués au hasard.
Remarque 6.12 La statistique inférentielle dépasse le cadre de ce cours. Dans la suite de

cette partie, nous nous concentrerons sur la statistique descriptive.
C HAPITRE 7
S ÉRIES STATISTIQUES À UNE VARIABLE
Résumé – Ce chapitre présente les méthodes usuelles de traitement des séries statistiques
à une variable. L’objectif est de savoir représenter graphiquement de telles séries et calculer
les indicateurs numériques qui y sont liés.
Sommaire
O
7.1 Description d’une série statistique à une variable . . . . . . . . . . . . . . 73
7.1.1 Description d’une série quantitative . . . . . . . . . . . . . . . . . . 73
LD
7.1.2 Description d’une série qualitative . . . . . . . . . . . . . . . . . . . 76
7.2 Représentations graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . 76
7.2.1 Variables quantitatives discrètes : diagramme en bâtons et poly-
A
gone des effectifs/fréquences . . . . . . . . . . . . . . . . . . . . . . 76

ER
7.2.2 Variables quantitatives continues . . . . . . . . . . . . . . . . . . . . 77

7.2.3 Variables qualitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
7.3 Caractéristiques numériques d’une distribution . . . . . . . . . . . . . . 81
.G
7.3.1 Les caractéristiques de position . . . . . . . . . . . . . . . . . . . . . 82

7.3.2 Les caractéristiques de dispersion . . . . . . . . . . . . . . . . . . . 87
7.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
C
I.
7.1 D ESCRIPTION D ’ UNE SÉRIE STATISTIQUE À UNE VARIABLE

7.1.1 Description d’une série quantitative
Soit X une variable quantitative observée sur une population Ω de taille n. Si X est
discrète, on note par { x1 , . . . , x p } l’ensemble de ses modalités. Nous supposons que les
valeurs x1 , . . . , x p sont ordonnées c’est-à-dire :
x1 < · · · < x p .
Définition 7.1 Si X est continue, les modalités sont regroupées en intervalles appelés classes
pour rendre les données plus lisibles. L’ensemble C des modalités est partagé en classes
C1 , . . . , C p , la classe Ci étant de la forme Ci = [ ai−1 , ai [ où ai−1 < ai . Les nombres ai−1 et
a i −1 + a i
ai sont appelés les bornes de la classe Ci , ci = son centre et li = ai − ai−1 son
2
73
amplitude. Par convention, a0 (resp. a p ) désigne la plus petite (resp. la plus grande) valeur
prise par X.
Définition 7.2 Soit X une variable discrète (resp. continue) décrite par ses modalités (resp.
ses classes) x1 , · · · , x p (resp. C1 = [ a0 , a1 [, . . ., C p = [ a p−1 , a p [). On appelle :
1) effectif de la valeur xi (resp. de la classe Ci ) : le nombre ni d’individus pour lesquels
X = xi (resp. X ∈ Ci c’est-à-dire ai−1 ⩽ X < ai ) ;
ni
2) fréquence de la valeur xi (resp. de la classe Ci ) : le rapport f i = ;
n
3) effectif cumulé croissant associé à xi (resp. à ai ) :
i
nic = n1 + · · · + ni = ∑ nk ;
k =1
en d’autres termes, nic est le nombre d’individus pour lesquels X prend les modalités
inférieures ou égales à xi (resp. ai ) ;
4) effectif cumulé décroissant associé à xi (resp. à ai−1 ) :
p
nid = ni + · · · + n p = ∑ nk ;
k =i
en d’autres termes, nid est le nombre d’individus pour lesquels X prend les modalités
supérieures ou égales à xi (resp. ai ).
5) On définit les fréquences cumulées croissantes et les fréquences cumulées décrois-
nic n
santes en divisant les effectifs cumulés correspondants par n. Ainsi f ic = et f id = id ,
n n
pour tout i = 1, . . . , p.
6) On appelle distribution statistique de la variable X, la suite de couples ( xi , ni ) (resp.
(Ci , ni )), i = 1, . . . , p.
Remarque 7.3
1) Les effectifs associés aux différentes modalités (ou classes) vérifient la relation
p
n1 + · · · + n p = ∑ ni = n.
i =1
2) Chaque fréquence f i est un nombre décimal compris entre 0 et 1 et peut donc être expri-
mée en pourcentage. De plus, la somme des fréquence est égale à 1 ou 100%.
3) On notera aussi que n pc = n1d = n et f pc = f 1d = 1 ou 100%.
4) Il est souvent plus commode de définir la distribution statistique d’une variable par un
tableau de données de la forme :
Chapitre 7. Séries statistiques à une variable 75
TABLE 7.1 – Exemple de distribution statistique d’une variable
Modalités x1 ... xp
Effectifs n1 ... np
TABLE 7.2 – Nombre d’enfants pour 40 couples.
Nombre d’enfants xi 0 1 2 3 4
Nombre de couples ni 12 20 5 2 1
Exemple 7.4 On a relevé le nombre d’enfants de 40 couples. Les résultats obtenus sont don-
nés dans le tableau 7.2.
Nous pouvons compléter ce tableau avec les fréquences et les effectifs cumulés.
xi 0 1 2 3 4
ni 12 20 5 2 1
O
nic 12 32 37 39 40
nid 40 28 8 3 1
LD
f i (%) 30 50 12.5 5 2.5
f ic (%) 30 80 92.5 97.5 100
A
f id (%) 100 70 20 7.5 2.5
ER
Quelle interprétation pouvons-nous donner aux valeurs en gras ? 12.5% des couples
interrogés ont exactement 2 enfants, 92.5% de ces couples ont 2 enfants ou moins, 20% des
couples ont 2 enfants ou plus.
.G
Exemple 7.5 On a noté l’âge (arrondi à l’année près) de 48 salariés d’une entreprise. La série
C
statistique brute (données obtenues pendant l’enquête) est donnée ci-dessous :

I.
43 29 57 45 50 29 37 59 46 31 46 24
33 38 49 31 62 60 52 38 43 26 41 52
60 49 52 41 38 26 37 59 57 41 29 33
33 43 46 57 46 33 46 49 57 57 46 43
Le tableau de données ci-dessous donne la distribution statistique de l’âge des 48 sa-

lariés en considérant les classes d’âge [20, 30[, [30, 40[, [40, 45[, [45, 50[, [50, 55[, [55, 60[ et
[60, 65[ :
TABLE 7.3 – Distribution statistique de l’âge des salariés.
Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[
ni 6 6 5 7 10 4 7 3
Les effectifs cumulés sont donnés par :

Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[
ni 6 6 5 7 10 4 7 3
nic 6 12 17 24 34 38 45 48
nid 48 42 36 31 24 14 10 3
Quelle interprétation pouvons-nous donner aux valeurs en gras ? 24 salariés ont moins
de 45 ans, 31 salariés ont 40 ans ou plus.
7.1.2 Description d’une série qualitative

Pour une variable qualitative, les notions d’effectif et de fréquence restent valables en
considérant les différentes modalités dudit caractère. Néanmoins, le calcul des effectifs cu-
mulés et des fréquences cumulées n’a de sens que pour les variables qualitatives ordinales.
Exemple 7.6 Reprenons les données du tableau 6.1 (page 71). L’effectif total de la popula-
tion est n = 6 191 155. Le tableau des fréquences est le suivant :
TABLE 7.4 – Tableau de fréquences associé aux données du RGPH 2010.

Nombre d’habitants 2 599 955 1 375 165 617 871 769 940 828 224
Fréquences 0.420 0.222 0.100 0.124 0.134
* Lomé - Commune inclus.
On peut y lire notamment que la région maritime abrite à elle seule 42% de la population
togolaise (en 2010).
7.2 R EPRÉSENTATIONS GRAPHIQUES

Elles permettent d’avoir rapidement une vue d’ensemble d’un tableau de données et de
mettre en évidence certains faits essentiels.
7.2.1 Variables quantitatives discrètes : diagramme en bâtons et polygone des

effectifs/fréquences
Soit ( xi , ni ), i = 1, . . . , p une série statistique quantitative discrète et soient f 1 , . . . , f p
les fréquences respectives de chaque modalité. Le diagramme en bâtons des effectifs (resp.
des fréquences) de cette distribution statistique est constitué de p segments verticaux d’abs-
cisses xi et de hauteur ni (resp. f i ).
Le polygone des effectifs (resp. des fréquences) est obtenu à partir du diagramme en
bâtons en joignant par un segment les sommets des bâtons.
Exemple 7.7 La figure 7.1 donne le diagramme à bâtons et le polygone des effectifs associés
au tableau 7.2.
20
20
15
15
Nombre de couples
Nombre de couples
10
10
5
5
0
0
0 1 2 3 4 0 1 2 3 4
Nombre d'enfants Nombre d'enfants
(a) Diagramme à bâtons (b) Polygone des effectifs
F IGURE 7.1 – Diagramme en bâtons et polygone des effectifs associés au tableau 7.2.
7.2.2 Variables quantitatives continues
O
Soit ([ ai−1 , ai [, ni ), i = 1, . . . , p une série statistique quantitative continue et soient f 1 , . . . , f p
les fréquences respectives associées à chaque classe.
LD
7.2.2.1 Histogramme
A
C’est un graphique formé de p rectangles juxtaposés tels que le rectangle associé à la

ER
classe i (i = 1, . . . , p) a une largeur égale à l’amplitude de la classe [ ai−1 , ai [ et une hauteur

égale à
fi
.G
hi = , i = 1, . . . , p. (7.1)
li
Ainsi, l’aire totale de l’histogramme est égale à 1.
C
L’histogramme donne rapidement une image de l’allure globale de la distribution ; il

montre l’étalement des données et apporte ainsi des renseignements sur la dispersion et
I.
sur les valeurs extrêmes ; il permet de déceler, éventuellement, des valeurs aberrantes.
Exemple 7.8 Reprenons le tableau 7.3 et complétons-le avec les hauteurs des rectangles
composant l’histogramme.
TABLE 7.5 – Données relatives à l’histogramme de l’âge des salariés.
Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[
ni 6 6 5 7 10 4 7 3
fi 6/48 6/48 5/48 7/48 10/48 4/48 7/48 3/48
li 10 5 5 5 5 5 5 5
hi ≃ 0.0125 0.025 0.0208 0.0292 0.0417 0.0167 0.0292 0.0125
L’histogramme est représenté sur la figure 7.2.

0.04
0.03
0.02
0.01
0.00
20 30 35 40 45 50 55 60 65
Age
F IGURE 7.2 – Histogramme de l’age des salariés.
Remarque 7.9 Une particularité de l’histogramme est que l’échelle verticale n’a pas de si-
gnification particulière. On peut vérifier qu’un histogramme représente les fréquences par
la surface des blocs et non par leur hauteur.
7.2.2.2 Polygone des effectifs (fréquences) cumulé(e)s
Le polygone des effectifs (fréquences) cumulé(e)s d’une distribution quantitative conti-

nue permet de représenter les effectifs (fréquences) cumulés croissants ou décroissants.
Nous nous attardons sur le polygone des fréquences qui est plus utilisé. Le principe de
construction de celui des effectifs est le même à condition de remplacer les fréquences par
les effectifs.
Le polygone des fréquences cumulées croissantes (resp. décroissantes) est obtenu en

plaçant dans un repère orthogonal, les points de coordonnées ( ai , f ic ) (resp. ( ai−1 , f id )) pour
i = 1, . . . , p. On joint par des segments de droite les points ( ai , f ic ) (resp. ( ai−1 , f id )) pour i =
1, . . . , p. Pour les points ( a0 , f 0c ) (resp. ( a p , f dp )), on adopte la convention f 0c = 0 (resp. f 0d =
1) et f pc = 1 (resp. f pd = 0) pour les fréquences cumulées croissantes (resp. décroissantes).
Exemple 7.10 Complétons les données du tableau 7.3 par les fréquences cumulées crois-
santes et décroissantes.
Les polygones des fréquences cumulées croissantes et décroissantes sont superposés sur
la figure 7.3.
Le polygone des fréquences cumulées croissantes est la courbe représentative de la fonc-

TABLE 7.6 – Fréquences cumulées de l’âge des salariés.
Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[
ni 6 6 5 7 10 4 7 3
fi 6/48 6/48 5/48 7/48 10/48 4/48 7/48 3/48
f ic 6/48 12/48 17/48 24/48 34/48 38/48 45/48 1
f id 1 42/48 36/48 31/48 24/48 14/48 10/48 3/48
1.0
0.8
Fréquences cumulées
0.6
0.4
O
0.2
LD
0.0
A
20 30 35 40 45 50 55 60 65
Age
ER
F IGURE 7.3 – Polygones des fréquences cumulées croissantes (ligne continue) et décroissantes (en
tirets) de l’âge des salariés.
.G
C
tion FX définie par :

I.


 0 si x < x0 ;







 i −1 x − a i −1
FX ( x ) =

∑ f j + a i − a i −1 f i si a i −1 ⩽ x < a i , i = 1 . . . , p; (7.2)

 j =1







1 si x ⩾ xp.
La valeur FX ( x ) est nulle pour les valeurs de x inférieures à la plus petite valeur a0 et égale
à 1 pour les valeurs de x supérieures à la plus grande valeur a p .
Pour tout x ∈ R, FX ( x ) est une estimation de la proportion des individus pour lesquels
X ⩽ x. Pour ce faire, on fait l’hypothèse fondamentale que les valeurs sont équiréparties
(uniformément réparties) au sein de chaque classe.
7.2.3 Variables qualitatives

7.2.3.1 Diagramme à barres
Le diagramme à barres verticales des effectifs ou des fréquences est une représenta-
tion graphique de la distribution d’une variable qualitative sur laquelle l’axe des abscisses
correspond aux différentes modalités de la variable et l’axe des ordonnées aux effectifs ou
fréquences associées.
Il est aussi possible de faire diagramme à barres horizontales des effectifs ou des fré-
quences. Dans ce cas, c’est plutôt l’axe des ordonnée qui correspond aux différentes moda-
lités de la variable et l’axe des abscisses aux effectifs ou fréquences associées.
Exemple 7.11 La figure 7.4 donne les diagrammes à barres verticales des effectifs et à barres
horizontales des fréquences associés au tableau 6.1.
Savanes
2500000
Kara
Centrale
1500000
Plateaux
500000
Maritime
0
Maritime Plateaux Centrale Kara Savanes

0.0 0.1 0.2 0.3 0.4 0.5
(a) Diagramme à barres verticales (effectifs) (b) Diagramme à barres horizontales (fré-
quences)
F IGURE 7.4 – Diagrammes à barres verticales (effectifs) et à barres horizontales (fréquences) associés
au tableau 6.1.
7.2.3.2 Diagramme à points

Le diagramme à points est une représentation graphique associée à une variable qua-
litative sur laquelle l’axe des ordonnées correspond aux différentes modalités et l’axe des
abscisses aux effectifs ou fréquences associés.
Exemple 7.12 Le diagramme à points associé aux données du tableau 6.1 est donné par la
figure 7.5.
7.2.3.3 Diagramme circulaire

Le diagramme circulaire est une représentation sous forme de cercle telle qu’à chacune
des modalités est associée une portion circulaire du diagramme proportionnelle à sa fré-
quence. Ainsi, les angles (compris entre 0 et 360°) correspondants à chaque portion sont
Savanes
Kara
Centrale
Plateaux
Maritime
1000000 1500000 2000000 2500000
F IGURE 7.5 – Diagramme à points associé aux données du RGPH 2010.
O
LD
obtenus par la formule :
ni
A
αi = 360 × = 360 × f i , i = 1, . . . , p. (7.3)
n
ER
Exemple 7.13 Reprenons les données du tableau 6.1 et complétons ce tableau par les angles
αi . On obtient le tableau suivant :
.G
TABLE 7.7 – Angles du diagramme circulaire associé aux données du RGPH 2010.
C

fi 0.420 0.222 0.100 0.124 0.134
I.
αi 151° 80° 36° 45° 48°
Le diagramme circulaire associé est donné par la figure 7.6.
7.3 C ARACTÉRISTIQUES NUMÉRIQUES D ’ UNE DISTRIBUTION

Le tableau de données complété avec les fréquences et les représentations graphiques
donne les premières informations sur le caractère et la population étudiés. Pour les carac-
tères quantitatifs en particulier, il existe certaines quantités qui permettent de mieux carac-
tériser la distribution statistique obtenue.
Remarque 7.14 Dans toute la suite de cette section, sauf mention contraire, nous considé-
rons un caractère quantitatif X étudié sur une population de taille n. Les observations seront
notées x1 , . . . , xn et les modalités x1 , . . . , x p .
Maritime
(42%)
Plateaux
(22.2%)
Savanes
(13.4%)
Centrale Kara
(10%) (12.4%)
F IGURE 7.6 – Diagramme circulaire associé aux données du RGPH 2010.
7.3.1 Les caractéristiques de position
Encore appelées caractéristiques de tendance centrale, elles donnent une idée de l’ordre
de grandeur des valeurs constituant la série.
7.3.1.1 Mode et classe modale
Définition 7.15 Soit X le caractère étudié.
1) Si X est une variable quantitative discrète ou qualitative, on appelle mode de la série

statistique obtenue et on note Mo( X ), l’une des modalités x1 , . . . , x p dont la fréquence
est maximale.
2) Si X est une quantitative continue, une classe modale, Mo( X ), est une classe de densité
(rapport fréquence/amplitude) maximale. Un mode est alors le centre de l’une de ces
classes.
Une distribution statistique est dite unimodale si elle a un seul mode et multimodale si
elle en a plusieurs.
7.3.1.2 Moyenne arithmétique (distribution discrète)
Définition 7.16 Lorsque l’on dispose des observations sur chacun des n individus de la
population sous la forme x1 , . . . , xn , la moyenne arithmétique est définie par :
1 n
n i∑
X= xi . (7.4)
=1
Lorsque la série statistique est donnée sous la forme ( x1 , n1 ), . . . , ( x p , n p ) en donnant les

modalités et les effectifs correspondants, la moyenne arithmétique est définie par la somme
pondérée suivante :
p p p
1 ni
X = ∑ ni xi = ∑ xi = ∑ f i xi . (7.5)
n i =1 i =1
n i =1
Proposition 7.17 Si X et Y sont deux variables quantitatives et si a et b sont des réels alors on a :
X + Y = X + Y, aX + b = aX + b et aX = aX.
O
LD
Remarque 7.18 La moyenne arithmétique est la mesure de tendance centrale des variables
quantitatives la plus utilisée. Chaque observation a le même poids qui est 1/n. La moyenne
arithmétique est sensible aux valeurs extrêmes.
A
7.3.1.3 Moyenne arithmétique (distribution continue)

ER
Pour les variables continues, on suppose que les observations d’une classe sont unifor-
mément réparties à l’intérieur de ladite classe. Cela revient à supposer que chaque centre est
.G
une bonne approximation de la moyenne de sa classe. Dans l’approximation de la moyenne,

on considère les centres des différentes classes :
C
p
n1 c1 + · · · + n p c p 1
X≃ = ∑ ni ci . (7.6)
n n i =1
I.
Remarque 7.19 Généralement quand l’on parle de moyenne, on pense tout de suite à la
moyenne arithmétique. Mais il existe d’autres types de moyennes (moyenne géométrique,
moyenne harmonique, moyenne quadratique) qui peuvent être plus adaptés dans certains
contextes particuliers. Ces autres types de moyennes ne sont pas abordés dans ce cours.
7.3.1.4 Médiane
Définition 7.20 La médiane est la valeur notée me qui partage la série des observations
classées par ordre croissant en deux parties comprenant exactement le même nombre d’ob-
servations de part et d’autre de me .
Dans la pratique, le calcul de la médiane utilise le tableau des effectifs (ou fréquences)
cumulés croissants. La médiane correspond à un effectif cumulé croissant de n/2 ou une
fréquence cumulée croissante de 50%.
■ Cas d’une distribution discrète.
Considérons les observations classées par ordre croissant :
x (1) ⩽ x (2) ⩽ · · · ⩽ x ( n −1) ⩽ x ( n ) .
On distingue deux cas suivant la parité de l’effectif de la population n :

• Si n est impair, alors on peut écrire n = 2k + 1 où k est un entier naturel non nul. On
peut décomposer la série comme suit :
x(1) ⩽ · · · ⩽ x(k) ⩽ x(k+1) ⩽ x(k+2) ⩽ · · · ⩽ x(2k+1) .

| {z } | {z }
k observations k observations
La médiane est donc la valeur
m e = x ( k + 1 ) = x ( n +1 ) .
2
• Si n est pair, alors on peut écrire n = 2k où k est un entier naturel non nul. On peut
décomposer la série comme suit :
x(1) ⩽ · · · ⩽ x(k) ⩽ x(k+1) ⩽ · · · ⩽ x(2k) .

| {z } | {z }
k observations k observations
La médiane peut être prise égale à toute valeur comprise entre x(k) et x(k+1) . Il est
d’usage de choisir la moyenne de ces deux valeurs comme médiane :
x ( k ) + x ( k +1)
me = .
2
Exemple 7.21
1) Considérons les dix observations suivantes : 1, 1, 1, 2, 2, 2, 2, 3, 3, 4. Le nombre 10 est
pair et sa moitié vaut 5. La médiane est la moyenne de la 5e et de la 6e observations soit
me = 2+2 2 = 2.
2) Considérons les sept observations suivantes : 0, 0, 1, 1, 2, 3, 4. Le nombre 7 est impair et
7+1
2 = 4. La médiane est la 4 observation soit me = 1.
e
■ Cas d’une distribution continue.
Considérons une distribution continue ([ a0 , a1 [, n1 ), . . . , ([ a p−1 , a p [, n p ). Le calcul de la

médiane se fait à l’aide des effectifs cumulés croissants ou des fréquences cumulées crois-
santes, la médiane étant la valeur correspond à l’effectif cumulé croissant n/2 ou à la fré-
quence cumulée croissante 50%. On distingue deux cas :
• S’il existe une classe Ci = [ ai−1 , ai [ telle que nic = n/2 ou f ic = 50%, alors me = ai ;
• Sinon il existe deux classes adjacentes Ci = [ ai−1 , ai [ et Ci+1 = [ ai , ai+1 [ telles que
nic < n/2 < n(i+1)c ou f ic < 50% < f (i+1)c . Ainsi ai < me < ai+1 et on calcule une
valeur approximative de me par interpolation linéaire. Pour faire ce calcul, on suppose
que la distribution est uniforme à l’intérieur de chaque classe.
L’interpolation linéaire consiste à dire que les trois points A( ai , nic ), B( ai+1 , n(i+1)c ) et
M (me , n/2) sont approximativement alignés.
n ( i +1) c B
•
n M
2 •
A
nic •
ai me a i +1
O
LD
F IGURE 7.7 – Illustration de l’interpolation linéaire pour l’approximation de la médiane
En utilisant le théorème de Thalès, on obtient

A
n
2− nic m e − ai
ER
=
n(i+1)c − nic a i +1 − a i
d’où
.G
n
2− nic
m e = a i + ( a i +1 − a i ) . (7.7)
n(i+1)c − nic
C
Cette dernière formule peut être réécrite en utilisant les fréquences :

1
− f ic
I.
2
m e = a i + ( a i +1 − a i ) . (7.8)
f (i+1)c − f ic
Remarque 7.22 Pour les distributions continues, la médiane est l’abscisse du point d’inter-
section des polygones des fréquences cumulées croissantes et décroissantes.
7.3.1.5 Les quartiles
Définition 7.23 Considérons une série statistique classée par ordre croissant. Les quartiles
sont trois valeurs notées Q1 , Q2 et Q3 qui partagent la distribution en quatre parties com-
prenant exactement le même nombre d’observations. Plus précisément, le premier quartile
(resp. le second quartile, resp. le troisième quartile) noté Q1 (resp. Q2 , resp. Q3 ) est la va-
leur correspondant à une fréquence cumulée croissante 25% (resp. 50%, resp. 75%) ou à
l’effectif cumulé croissant n4 (resp. n2 , resp. 3n
4 ).
Remarque 7.24 En particulier, le second quartile est confondu à la médiane.
Ici aussi, supposons les observations classées par ordre croissant :

x (1) ⩽ x (2) ⩽ · · · ⩽ x ( n −1) ⩽ x ( n ) .
On distingue deux cas :
• Si n est multiple de 4, alors on peut écrire n = 4k où k est un entier naturel non nul.
Le premier quartile peut être pris égal à toute valeur comprise entre x(k) et x(k+1) . Il
est d’usage de choisir la moyenne de ces deux valeurs comme médiane :
x ( k ) + x ( k +1)
Q1 = .
2
Idem pour le troisième quartile :
x(3k) + x(3k+1)
Q3 = .
2
• Si n n’est pas multiple de 4, alors on note k et k′ les parties entières respectives de
n/4 et 3n/4. Les premier et troisième quartiles sont définis par : Q1 = x(k+1) et Q3 =
x ( k ′ +1) .
Exemple 7.25
1) Considérons les dix observations suivantes : 1, 1, 1, 2, 2, 2, 2, 3, 3, 4. Le nombre 10 n’est
pas multiple de 4. On a 10/4 = 2.5 et 3 × 10/4 = 7.5. On a donc Q1 = x(3) = 1 et
Q3 = x(8) = 3.
2) Considérons les huit observations suivantes : 0, 0, 1, 1, 2, 3, 4, 5. Le nombre 8 est multiple
de 4 et 84 = 2. Le premier quartile est la moyenne de la 2e et de la 3e observations soit
Q1 = 0.5. On vérifie de même que Q3 = 3.5.
Le calcul du quartile Q1 (resp. Q3 ) se fait en utilisant la même méthode que celle décrite
pour la médiane en prenant soin de remplacer la fréquence cumulée croissante 50% par 25%
(resp. 75%) et l’effectif cumulé croissant n/2 par n/4 (resp. 3n/4).
7.3.1.6 Les quantiles
Définition 7.26 Soit X une variable quantitative étudiée sur une population et soit α ∈
[0, 1]. On appelle quantile (ou fractile) d’ordre α, la valeur xα de la variable X telle que la
proportion d’observations inférieures ou égales à xα soit égale à α.
Les quantiles les plus usuels sont la médiane et les quartiles. La médiane est le quantile
d’ordre 50%, les quartiles Q1 et Q3 sont les quantiles d’ordres respectifs 25% et 75%.
7.3.2 Les caractéristiques de dispersion

Les caractéristiques de dispersion informent sur la répartition des modalités du carac-
tère étudié autour des caractéristiques de tendance centrale.
7.3.2.1 Variance et écart-type

Définition 7.27 Lorsque l’on dispose des observations x1 , . . . , xn , la variance (ou écart qua-
dratique moyen) est définie par :
1 n
n i∑
Var( X ) = ( x i − X )2 . (7.9)
=1
Lorsque la série statistique est donnée sous la forme ( x1 , n1 ), . . . , ( x p , n p ) en donnant les

modalités et les effectifs correspondants, la moyenne quadratique est définie par :
O
p
1
n i∑
Var( X ) = n i ( x i − X )2 . (7.10)
=1
LD
La racine carrée de la variance notée σX est appelée écart-type de X :
q
A
σX = Var( X ). (7.11)
ER
Dans la pratique, on utilise la formule suivante dite formule de König-Huygens :

.G
Théorème 7.28 (Formule de König-Huygens) On a :

!
1 n 1 n 2 2
n i∑ ∑ x i − X = X 2 − ( X )2
2
( xi − X ) = (7.12)
C
=1
n i =1
ou encore
I.
!
p p
1 1 2
n i∑ n i∑
n i ( x i − X )2 = ni xi2 − X = X 2 − ( X )2 . (7.13)
=1 =1
où X 2 désigne la moyenne des carrés. En d’autres termes, la variance est égale à la moyenne (arith-
métique) des carrées moins le carré de la moyenne.
Lorsqu’on ne dispose que des classes, il n’est pas possible de trouver une valeur exacte
de la variance. En supposant que les données sont uniformément distribuées à l’intérieur
de chaque classe, on obtient une approximation de la variance par la formule
p
1
n i∑
Var( X ) ≃ n i ( c i − X )2
=1
où c1 , . . . , c p sont les centres des différentes classes.

Remarque 7.29 La variance et l’écart-type sont les caractéristiques de dispersion les plus
utilisée. L’écart-type présente l’avantage de s’exprimer dans la même unité que la variable
étudiée.
Proposition 7.30 (Propriétés de la variance)

1) La variance est toujours un nombre réel positif (puisque c’est une somme de carrés).
2) La variance est nulle si, et seulement si, X possède une seule valeur.
3) Si X est une variable quantitative et si a et b sont deux réels, on a
Var( aX + b) = a2 Var( X ).
7.3.2.2 Autres caractéristiques de dispersion

• Etendue : C’est la différence entre la plus grande et la plus petite des valeurs prises
par le caractère : e( X ) = max( X ) − min( X ).
• Etendue interquartile : C’est le réel noté EIQ et défini par EIQ = Q3 − Q1 .
• Intervalle interquartile : C’est l’intervalle I = [ Q1 , Q3 ]. Il comporte 50% des observa-

tions équitablement réparties autour de la médiane Q2 . Un intervalle I petit implique
une forte concentration des valeurs du caractère autour de la médiane.
• Ecart absolu moyen : C’est le réel défini par

1 n
n i∑
em = | xi − X |
=1
lorsque l’on dispose des observations x1 , . . . , xn et par

p
1
n i∑
em = n i | x i − X |.
=1
lorsque la série statistique est donnée sous la forme ( x1 , n1 ), . . . , ( x p , n p ) avec les mo-
dalités et les effectifs. L’écart moyen donne l’ordre de grandeur des déviations autour
de la moyenne.
• Coefficient de variation : Il est défini pour les variables positives comme le rapport
de l’écart-type avec la moyenne arithmétique :
σX
CV = .
X
Le coefficient de variation est un nombre sans unité et est invariable par changement
d’échelle sur les données. Il permet donc de comparer les dispersions du caractère
sur des populations ayant des valeurs moyennes très différentes ou de comparer des
variables quantitatives différentes même si les données ne sont pas exprimées dans
les mêmes unités. Un CV petit indique une distribution du caractère moins dispersée.
Exemple 7.31 Reprenons les données du tableau 7.2.
xi 0 1 2 3 4
ni 12 20 5 2 1
Calculons la moyenne, l’écart-type, la médiane, les quartiles Q1 et Q3 .
• Moyenne :
1
X= (12 × 0 + 20 × 1 + 5 × 2 + 2 × 3 + 1 × 4) = 1.
40
• Ecart-type :
1
Var( X ) = (12 × 0 + 20 × 1 + 5 × 4 + 2 × 9 + 1 × 16) − 1 = 0.85
40
√
d’où σX = 0.85 ≃ 0.9219544.
O
• Médiane : rangeons les données dans l’ordre croissant. Comme le nombre d’obser-
vations est pair (n = 40),
x(20) + x(21)
LD
me = = 1.
2
• Quartiles Q1 et Q3 : n = 40 est multiple de 4 et k = n4 = 10. Ainsi,
A
x(10) + x(11) x(30) + x(31)

ER
Q1 = =0 et Q3 = = 1.
2 2
Exemple 7.32 Reprenons les données du tableau 7.3. Complétons le tableau avec quelques
.G
données utiles et calculons l’étendue, la moyenne, l’écart-type, la médiane, les quartiles Q1

et Q3 .
C
Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[
ci 25 32.5 37.5 42.5 47.5 52.5 57.5 62.5
I.
ni 6 6 5 7 10 4 7 3
nic 6 12 17 24 34 38 45 48
• Etendue : e( X ) = 65 − 20 = 45.
• Moyenne :
1 8
48 i∑
X≃ ni ci ≃ 43.85417.
=1
• Ecart-type : Var( X ) ≃ 122.9058 d’où σX ≃ 11.08629.

• Médiane : elle correspond à l’effectif cumulé croissant 24. Il n’y a pas besoin d’in-
terpolation linéaire car l’effectif cumulé croissant 24 est associé à 45. Ainsi, me = 45
ans.
• Quartile Q1 : Q1 correspond à un effectif cumulé croissant de 48/4 = 12 et comme
pour la médiane, on lit directement Q1 = 35 ans.
• Le quartile Q3 correspond à un effectif cumulé croissant de 3 × 48

4 = 36. Cette valeur
n’apparaît pas dans les effectifs cumulés croissants mais on voit que 34 < 36 < 38
d’où on déduit que 50 < Q3 < 55. On utilise la formule d’interpolation linéaire :
36 − 34
Q3 = 50 + (55 − 50) × = 52.5.
38 − 34
7.4 E XERCICES
Exercice 7.1 La répartition des élèves d’un lycée en fonction de la langue vivante étudiée
est donnée par le tableau suivant :
Langue Anglais Allemand Espagnol Italien Autres Total
Effectifs 934 351 205 69 41 1600
1) Préciser la population étudiée, l’unité statistique, le caractère, sa nature et ses modalités.
2) Compléter le tableau avec les fréquences.
3) Représenter cette distribution par un diagramme à secteurs.
4) Préciser le mode du caractère étudié.
5) Quel est le pourcentage d’élèves qui n’étudient pas l’anglais ?
Exercice 7.2 Un institut de statistique a réalisé une enquête sur le nombre de salariés de 40
entreprises de Lomé-la-belle. Les résultats suivants rangés dans l’ordre croissant sont les
suivants :
O
20 22 24 30 32 36 37 39 40 41
43 44 45 45 47 48 50 51 51 52
LD
52 53 53 55 56 58 59 59 61 62
63 64 66 75 76 79 82 86 90 99
A
1) Définir la population, l’unité statistique, le caractère étudié et sa nature.

2) Etablir la distribution des entreprises selon le nombre de salariés. Pour ce faire, on définit
ER
cinq (5) classes de la forme [ ai , ai+1 [ d’amplitudes respectives 20, 10, 10, 20, 20. La valeur
minimale est 20 et la valeur maximale est 100. On complètera le tableau obtenu en y
.G
ajoutant les fréquences et les fréquences cumulées.

3) Tracer l’histogramme des fréquences de cette distribution.
C
4) Calculer le mode, la médiane, la moyenne et l’écart-type du nombre de salariés.

5) Calculer à nouveau la médiane et la moyenne mais cette fois-ci en utilisant les données
I.
brutes et non les classes. Que remarquez-vous ?
Exercice 7.3 Le tableau suivant donne la répartition du personnel d’une société suivant le
salaire mensuel en kFCFA (milliers de FCFA) :
Salaire [150,160[ [160,170[ [170,180[ [180,190[ [190,200[ [200,250[ [250,300[
Effectif 5 13 15 18 14 4 5
1) Calculer la moyenne, la variance, l’écart-type, la médiane et les quartiles Q1 et Q3 .
2) Déterminer le pourcentage de personnel dont le salaire est inférieur à 200 kFCFA.
Exercice 7.4 Dans un laboratoire pharmaceutique, une machine automatique fabrique en

grande quantité des suppositoires contenant du paracétamol. On veut contrôler la qualité
de la fabrication sur une période donnée. Dans ce but, pendant le fonctionnement de la
machine, on prélève de temps à autre un suppositoire dont on mesure la masse X (en mg) de
paracétamol qu’il contient. Les résultats des mesures de l’échantillon prélevé sont donnés
dans le tableau suivant :
Masse (mg) [145, 155[ [155, 165[ [165, 175[ [175, 185[ [185, 195[
Effectifs 7 30 43 16 4
Faire une étude graphique et un résumé statistique de la masse de paracétamol des suppo-
sitoires fabriqués dans ce laboratoire.
Exercice 7.5 On observe l’arrivée des clients à un bureau de poste pendant un intervalle de
temps donné. En répétant 100 fois l’observation, on obtient les résultats suivants :
Nombre d’arrivées 1 2 3 4 5 6
Effectif 15 25 26 20 7 7
Calculer la moyenne, la variance, l’écart-type, le coefficient de variation, la médiane, les

quartiles Q1 et Q3 et l’intervalle inter-quartile.
C HAPITRE 8
S ÉRIES STATISTIQUES À DEUX VARIABLES
Résumé – Ce chapitre présente les méthodes usuelles de traitement des séries statistiques à
deux variables. L’objectif est de savoir faire une étude statistique descriptive sur les données
observées sur une population dans un cadre bivarié et plus spécifiquement, de savoir faire
des prévisions à l’aide d’un ajustement linéaire ou non linéaire.
Sommaire
O
8.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
LD
8.2 Caractéristiques numériques . . . . . . . . . . . . . . . . . . . . . . . . . . 95
8.2.1 Cas des données non groupées . . . . . . . . . . . . . . . . . . . . . 95
8.2.2 Cas des tableaux de contingence (données groupées) . . . . . . . . 96
A
8.3 Représentation graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

ER
8.4 Ajustement linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

8.4.1 Notion d’ajustement . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
8.4.2 Méthode des moindres carrés ordinaires (MCO) . . . . . . . . . . . 99
.G
8.4.3 Qualité de l’ajustement par MCO . . . . . . . . . . . . . . . . . . . . 101

8.5 Exemples d’application de l’ajustement linéaire à l’ajustement non li-
C
néaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
8.5.1 Ajustement par une fonction puissance . . . . . . . . . . . . . . . . 103
I.
8.5.2 Ajustement par une fonction exponentielle . . . . . . . . . . . . . . 103

8.5.3 Ajustement par une fonction logistique . . . . . . . . . . . . . . . . 103
8.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
8.1 G ÉNÉRALITÉS
Dans une enquête statistique, il est rare de ne s’intéresser qu’à une seule variable sta-
tistique. Une « intuition » des spécialistes d’un domaine peut conduire à observer deux ou
plusieurs variables chez une même population et à rechercher l’existence d’un lien de dé-
pendance entre ces variables. Dans ce chapitre, nous nous focalisons sur le cas de deux
variables.
Définition 8.1 Soient Ω une population de taille n, X et Y deux variables statistiques obser-
vées sur Ω. On appelle série statistique à deux variables X et Y (ou à deux dimensions ou
93
série statistique double), l’application qui à chaque individu ωi ∈ Ω (i = 1, . . . , n) associe le

couple ( xi , yi ) des valeurs prises respectivement par X et Y pour ledit individu.
L’ensemble des couples ( xi , yi ), i = 1, . . . , n est appelée distribution statistique du

couple ( X, Y ). Cette distribution statistique du couple ( X, Y ) est souvent présentée sous
deux formes : (1) données brutes ou données non groupées et (2) données groupées ou
tableau de contingence).
• Le tableau de données brutes est un tableau à deux lignes de la forme
X x1 ··· xi ··· xn
Y y1 ··· yi ··· yn
ou à trois lignes ayant la forme
Individu 1 ··· i ··· n
X x1 ··· xi ··· xn
Y y1 ··· yi ··· yn
• Le tableau de contingence est un tableau à double entrée de la forme
Y
y1 ··· yj ··· yq ni •
X
x1 n11 ··· n1j ··· n1q n 1•
··· ··· ··· ··· ··· ··· ···
xi ni1 ··· nij ··· niq ni •
··· ··· ··· ··· ··· ··· ···
xp n p1 ··· n pj ··· n pq n p•
n• j n •1 ··· n• j ··· n•q n
où pour tous i = 1, . . . , p et j = 1, . . . , q, nij est le nombre d’individus vérifiant simul-
tanément X = xi et Y = y j ,
q
ni • = ∑ nij = nombre d’individus pour lesquels X = xi ,
j =1
p
n• j = ∑ nij = nombre d’individus pour lesquels Y = y j
i =1
et
p q p q
n= ∑ ∑ nij = ∑ ni • = ∑ n• j .
i =1 j =1 i =1 j =1
La dernière colonne (en rouge) et la dernière ligne (en bleu) du tableau (appelées
marges) contiennent respectivement les effectifs totaux par ligne et par colonne. Elles
donnent respectivement la distribution marginale de X définie par le tableau
X x1 x2 ··· xp Total
Effectif ni• n 1• n 2• ··· n p• n
Chapitre 8. Séries statistiques à deux variables 95
et celle de Y définie par :

Y y1 y2 ··· yq Total
Effectif n• j n •1 n •2 ··· n•q n
Exemple 8.2 On mesure sur la même parcelle de terrain le rendement Y en quintaux par
hectare (q/ha) en fonction de la quantité X d’engrais répartie sur la parcelle mesurée en
kg/ha. Les données sont consignées dans le tableau suivant :
Quantité xi 100 200 300 400 500 600 700
Rendement yi 40 50 50 70 65 65 80
Exemple 8.3 Dans une université, on a enquêté auprès de 5375 étudiants n’ayant aucun lien
de parenté entre eux, sur leurs habitudes tabagiques (variable Y) et celles de leurs parents
(variable X). Les données obtenues sont consignées dans le tableau suivant :
Statut de l’étudiant
Nombre de Fumeur Non Total
parents fumeurs fumeur
O
Deux 400 1380 1780
Un seul 416 1823 2239
LD
Aucun 188 1168 1356
Total 1004 4371 5375
A
Les distributions marginales de X et Y sont respectivement données par les tableaux

ER
Nombre de parents fumeurs Deux Un seul Aucun Total

Effectif 1780 2239 1356 5375
.G
et
Statut de l’étudiant Fumeur Non fumeur Total
C
Effectif 1004 4371 5375

I.
8.2 C ARACTÉRISTIQUES NUMÉRIQUES

8.2.1 Cas des données non groupées
Les moyennes et variances des variables X et Y se calculent par les formules usuelles
comme suit :
1 n 1 n
X = ∑ xi , Y = ∑ yi
n i =1 n i =1
1 n 1 n 2 1 n 1 n 2
n i∑ ∑ x i − ( X )2 , n i∑ ∑ y i − (Y ) 2 ,
2 2
Var( X ) = ( x i − X ) = Var(Y ) = ( y i − Y ) =
=1
n i =1 =1
n i =1
Les écarts types sont respectivement définies par
q q
σX = Var( X ) et σY = Var(Y ).
Les valeurs caractéristiques de la liaison entre les variables X et Y sont

• la covariance de X et Y définie par
1 n 1 n
n i∑ n i∑
Cov( X, Y ) = ( x i − X )( y i − Y ) = xi yi − XY.
=1 =1
• et le coefficient de corrélation linéaire entre X et Y défini par :
Cov( X, Y ) Cov( X, Y )
ρ XY = p p = ∈ [−1, 1].
Var( X ) Var(Y ) σX σY
Exemple 8.2 (suite) On vérifie que X = 400, Y = 60, n1 ∑in=1 xi yi = 26357.143 donc Cov( X, Y ) =
2357.143. De plus, Var( X ) = 40000, Var(Y ) = 164.2857 donc σX = 200 et σY = 12.8174.
Finalement, ρ XY ≃ 0.92.
8.2.2 Cas des tableaux de contingence (données groupées)

Dans ce cas aussi, les moyennes, variances et écarts types des variables X et Y se cal-
culent par les formules usuelles comme suit :
p q
1 1
n i∑ ∑ y• j ,
X= ni • xi , Y=
=1
n j =1
p p
1 1
Var( X ) = ∑
n i =1
ni• ( xi − X )2 = ∑ ni• xi2 − ( X )2 ,
n i =1
q q
1 1
Var(Y ) = ∑
n j =1
n• j (y j − Y )2 = ∑ n• j y2j − (Y )2 ,
n j =1
q q
σX = Var( X ) et σY = Var(Y ).
La covariance est calculée à l’aide de la formule
p q p q
1 1
Cov( X, Y ) = ∑ ∑ nij ( xi − X )(y j − Y ) = ∑ ∑ nij xi y j − XY.
n i =1 j =1 n i =1 j =1
Remarque 8.4 Lorsque les modalités des variables X et/ou Y sont des intervalles (ou classes),
les xi et/ou y j sont remplacés par les centres des classes.
L’analyse descriptive d’un tableau de contingence est facilitée par le calcul de deux ta-
bleaux des fréquences conditionnelles appelés profils-lignes et profils-colonnes.
Définition 8.5 On appelle :

• profils-lignes, le tableau obtenu en divisant chaque ligne par la somme de ladite ligne
c-est-à-dire le tableau formé des fréquences
nij
= proportion d’individus de la modalité xi ayant la modalité y j ;
ni •
• profils-colonnes, le tableau obtenu en divisant chaque colonne par la somme de ladite

colonne c-est-à-dire le tableau formé des fréquences
nij
= proportion d’individus de la modalité y j ayant la modalité xi .
n• j
Remarque 8.6 Dans le tableau des profils-lignes, la somme de chaque ligne vaut 1 et la
somme des colonnes n’a pas de sens et doit donc être évitée. De même, dans le tableau des
profils-colonnes, la somme de chaque colonne vaut 1 et la somme des lignes n’a pas de sens
et doit aussi être évitée.
Exemple 8.3 (suite)

• Le tableau des profils-lignes arrondis à trois chiffres après la virgule est donné par :
Nombre de Fumeur Non Total
O
parents fumeurs fumeur
Deux 0.2247 0.7753 1
LD
Un seul 0.1858 0.8142 1
Aucun 0.1386 0.8614 1
A
On peut interpréter la première ligne comme suit : parmi les étudiants dont les deux
parents sont fumeurs, il y en a 22.47% qui sont fumeurs et 77.53% qui sont non-
ER
fumeurs.
• Le tableau des profils-colonnes arrondis à quatre chiffres après la virgule est donné
.G
par :
C
Nombre de Fumeur Non fumeur

parents fumeurs
I.
Deux 0.3984 0.3157

Un seul 0.4143 0.4171
Aucun 0.1873 0.2672
Total 1 1
On peut interpréter la première colonne comme suit : parmi les étudiants fumeurs,
39.84% ont les deux parents qui sont fumeurs, 41.43% ont un seul parent fumeur et
18.73% n’ont aucun parent fumeur.
8.3 R EPRÉSENTATION GRAPHIQUE

On représente souvent un tableau de données brutes (ou non groupées) par un nuage
de points dans un repère orthogonal du plan. Dand le cas d’un tableau de contingence, il
est plus utile de représenter les profils-lignes et/ou profils-colonnes par un diagramme à
barres juxtaposées.
Exemple 8.2 (suite) Le nuage de points associé aux données de l’exemple 8.2 est donné par
la figure 8.1 (page 98).
80
70
Rendement (q/ha)
60
50
40
100 200 300 400 500 600 700
Quantité d'engrais (kg/ha)
F IGURE 8.1 – Nuage de points des données du rendement
Exemple 8.3 (suite) Les diagrammes à barres juxtaposées associés aux profils-lignes et
profils-colonnes de l’exemple 8.3 sont donnés par la figure 8.2 (page 98).
Enfant fumeur Enfant non fumeur Deux Un seul Aucun

100
60
Proportion de parents fumeurs (en %)
Proportion d'enfants fumeurs (en %)
50
80
40
60
30
40
20
20
10
0
Deux Un seul Aucun Enfant fumeur Enfant non fumeur
Nombre de parents fumeurs Statut de l'étudiant (enfant)
(a) Profils-lignes (b) Profils-colonnes
F IGURE 8.2 – Diagrammes à barres juxtaposées associés aux profils-lignes et profils-colonnes de

l’exemple 8.3
8.4 A JUSTEMENT LINÉAIRE

8.4.1 Notion d’ajustement
L’ajustement consiste à chercher une relation de la forme
Y = f (X) (8.1)
de sorte que la courbe représentative de f passe le « plus près possible » de tous les points
du nuage. Dans ce cas, la variable X est appelée variable explicative ou variable endogène
et la variable Y est appelée variable expliquée ou variable exogène.
Lorsque f ( x ) = ax + b avec a, b ∈ R, on parle d’ajustement linéaire. Sinon, on parle

d’ajustement non linéaire.
L’ajustement linéaire est très utilisé dans la pratique non seulement à cause de sa simpli-
cité mais aussi certains ajustements non linéaires (que nous verrons dans la suite) peuvent
être ramenés à un ajustement linéaire au moyen d’une transformation mathématique et/ou
O
d’un changement de variable. LD
8.4.2 Méthode des moindres carrés ordinaires (MCO)
A
y
(∆) : y = ax + b
ER
εn •
•
.G
axi + b •
εi
yi •
C
ε1 •
•
I.
x1 xi xn x
F IGURE 8.3 – Nuage de points et MCO
On cherche la droite (∆) d’équation y = ax + b (a, b ∈ R) qui passe le plus près possible
de tous les points du nuage.
Définition 8.7 Pour tout i = 1, . . . , n, on appelle :

• valeur ajustée de yi , la quantité ŷi = axi + b ;
• résidu en i, la quantité ε i = yi − ŷi = yi − axi − b.
Soit ε = (ε 1 , . . . , ε n ) le vecteur des résidus. Le principe de la méthode des moindres car-

rés ordinaires (MCO) consiste à rechercher les réels a et b qui rendent minimum la somme
des carrés des résidus (SCR)

n n
∥ ε ∥2 = ∑ ε2i = ∑ (yi − axi − b)2 (8.2)
i =1 i =1
qui est une fonction de a et b. On montre le théorème suivant.

Théorème 8.8 Le couple ( a, b) permettant de minimiser la SCR ∥ε∥2 est donné par
Cov( X, Y )
a= et b = Y − aX. (8.3)
Var( X )
Définition 8.9 La droite d’équation y = ax + b, où a et b sont définis par l’équation (8.3),

est appelée droite de régression de Y en X. Elle est notée DY/X .
Exemple 8.2 (suite) On continue avec l’exemple 8.2.

• En arrondissant à 5 cinq chiffres après la virgule, on obtient l’équation suivante pour
la droite de régression de Y en X :
( DY/X ) : y = 0.05893 x + 36.42857.
• L’ajustement de la droite de régression au nuage de points est donné par la figure 8.4
(page 100).
80
70
Rendement (q/ha)
60
50
40
100 200 300 400 500 600 700
Quantité d'engrais (kg/ha)
F IGURE 8.4 – Ajustement de la droite de régression sur le nuage de points des données du rende-
ment
• On peut prévoir le rendement pour une quantité d’engrais de 350 kg/ha :
ŷ(350) = 0,058 93 × 350 + 36,428 57 ≈ 57 q/ha.

Remarque 8.10 Pour obtenir la droite de régression de X en fonction de Y, il suffit de per-

muter les rôles des deux variables c’est-à-dire que l’on a
( DX/Y ) : x = a′ y + b′ , (8.4)
où
Cov( X, Y )
a′ = et b′ = X − a′ Y.
Var(Y )
Remarque 8.11 Pour que la droite de régression ( DX/Y ) puisse être déduite de ( DY/X ), il
faudrait aussi que l’on ait
y b
x = − = a′ y + b′
a a
1
c’est-à-dire a′ = a (puisque cette relation entraîne b′ = −b/a). On aurait donc
Cov( X, Y ) Var( X )
=
Var(Y ) Cov( X, Y )
O
soit
(Cov( X, Y ))2
LD
=1
Var( X )Var(Y )
soit encore ρ2XY = 1.
A
ER
8.4.3 Qualité de l’ajustement par MCO

Comment sait-on si un ajustement linéaire est acceptable ou non ? Pour répondre rigou-
.G
reusement à cette question, nous avons besoin de certaines notions et techniques de statis-
tique inférentielle qui dépassent largement le cadre de ce cours. Toutefois, nous donnons
quelques indicateurs pouvant permettre de répondre à cette question.
C
Définition 8.12 On appelle :

I.
• variance totale, la quantité
1 n
n i∑
VT = (yi − Y )2 = Var(Y );
=1
• variance expliquée (par le modèle), la quantité
1 n
n i∑
VE = (ŷi − Y )2 ;
=1
• variance résiduelle, la quantité
1 n 2 1 n
n i∑ ∑ (yi − ŷi )2 .
VR = ε i =
=1
n i =1
Théorème 8.13 Les trois variances définies plus haut vérifient la relation suivante
VT = VE + VR (8.5)
appelée équation d’analyse de la variance.
La qualité de l’ajustement est jugée par le coefficient de détermination défini comme

suit.
Définition 8.14 On appelle coefficient de détermination de la régression, le coefficient noté R2

et défini par :
VE
R2 = .
VT
Dans la pratique, pour calculer R2 , on utilise plutôt le théorème suivant.
Théorème 8.15 Le coefficient de détermination est le carré du coefficient de corrélation linéaire

c’est-à-dire :
R2 = (ρ XY )2 .
Par la formule (8.5) ou par le fait que −1 ⩽ ρ XY ⩽ 1, il est clair que
0 ⩽ R2 ⩽ 1.
Plus R2 est grand (proche de 1), plus la variance expliquée est grande et plus la variance
résiduelle est faible. En d’autres termes, plus R2 est proche de 1, plus on peut dire que
la droite de régression s’ajuste « bien » aux données observées. Le coefficient R2 mesure
donc la proportion de la variabilité (ou la proportion de l’information) contenue dans les
données que la droite de régression a su expliquer. Il mesure donc aussi l’intensité de la
liaison linéaire entre ( x1 , . . . , xn ) et (y1 , . . . , yn ).
Exemple 8.2 (suite et fin) On trouve R2 ≈ 0.85 donc on peut dire l’ajustement linéaire
explique environ 85% de l’information contenue dans les données.
Remarque 8.16 Le coefficient R2 permet seulement de juger le degré de liaison linéaire

entre X et Y. Il ne faut en aucun cas interpréter la validité du modèle comme représentant le
degré de liaison causale ou explicative entre Y et X. Le R2 peut être très élevé pour d’autres
raisons qu’une relation d’explication. Une erreur courante est de croire qu’un coefficient de
détermination élevé (et donc un coefficient de corrélation linéaire élevé) induit une relation
de causalité (cause à effet) entre deux variables. En réalité, les deux variables peuvent être
corrélées à une même troisième variable (le temps par exemple) dont dépendent les deux
autres.
8.5 E XEMPLES D ’ APPLICATION DE L’ AJUSTEMENT LINÉAIRE À

L’ AJUSTEMENT NON LINÉAIRE
8.5.1 Ajustement par une fonction puissance

Il s’agit des ajustements de la forme
y = bx a
où y et x sont des variables positives et a ∈ R et b ∈ R+ sont à déterminer. En passant au

logarithme, on obtient
ln y = a ln x + ln b.
On pose z = ln y, u = ln x et on obtient un ajustement linéaire de la forme z = au + k où a
et k sont calculés par la méthode MCO. On en déduit b = ek .
8.5.2 Ajustement par une fonction exponentielle
O
Il s’agit des ajustements de la forme LD
y = be ax
où y est une variable positive et a ∈ R et b ∈ R+ sont à déterminer. En passant au loga-

A
rithme, on obtient
ln y = ax + ln b.
ER
On pose z = ln y et on obtient un ajustement linéaire de la forme z = ax + k où a et k sont

calculés par la méthode MCO. On en déduit b = ek .
.G
8.5.3 Ajustement par une fonction logistique

C
Il s’agit des ajustements de la forme

I.
1
y=
1 + e−(ax+b)
où y est une variable positive et a ∈ R et b ∈ R+ sont à déterminer. On a :
1 1
y= ⇐⇒ = 1 + e−(ax+b)
1 + e−(ax+b) y
1
⇐⇒ − 1 = e−(ax+b)
y
1−y
⇐⇒ = e−(ax+b)
y

1−y
⇐⇒ ln = −( ax + b)
y

y
⇐⇒ ln = ax + b.
1−y
En posant
y
z = ln ,
1−y
on obtient un ajustement linéaire de la forme z = ax + b où a et k sont calculés par la
méthode MCO.
8.6 E XERCICES
N.B. L’on pourra consulter l’annexe B pour une illustration graphique des différents ajus-
tements.
Exercice 8.1 L’observation des prix et des quantités sur un marché de la tomate a donné les
résultats suivants :
Quantités x en kg 10 20 35 50 70 90 110 130
Prix y au kg en kFCFA 5 3.75 2.75 2.25 1.75 1.25 0.8 0.5
où 1 kFCFA = 1000 FCFA. Ainsi, une quantité de 35 kg de tomates est vendue au prix de
2750 FCFA le kg.
1) Représenter le nuage de points.
2) (a) Déterminer la droite d’ajustement linéaire y = ax + b par la méthode MCO.
(b) Prévoir le prix d’un kg de tomates pour un achat de 140 kg et en déduire que l’ajus-
tement linéaire n’est pas réaliste.
O
3) (a) Chercher maintenant un ajustement non linéaire de la forme y = a ln x + b. On
LD
pourra poser z = ln x et se ramener à un ajustement linéaire y = az + b.
(b) Calculer le coefficient R2 de l’ajustement linéaire entre z et y.
(c) Prévoir le prix au kg pour un achat de 140 kg.
A
ER
Exercice 8.2 On a relevé la distance de freinage y d’un véhicule (distance parcourue par
le véhicule entre le moment où le conducteur commence à freiner et l’arrêt du véhicule) à
décélération constante sur une route plane sèche pour différentes vitesses x en km/h. Les
.G
données sont consignées dans le tableau suivant :
x (en km/h) 30 50 90 110 130

C
y (en m) 5.1 14.1 45.5 68 95

I.
Les experts affirment que la distance d’arrêt d’un véhicule est proportionnelle à son énergie
cinétique et donc au carré de sa vitesse. On cherche à confirmer cela à l’aide d’un ajustement
par une fonction puissance de la forme y = kx α , où k et α sont des constantes à déterminer.
1) Montrer en faisant un changement de variable simple, qu’on peut se ramener à un pro-
blème de régression linéaire simple puis déterminer les coefficients k et α par la méthode
des moindres carrés.
2) Les résultats obtenus confirment-ils l’affirmation des experts ?
3) Confirmer la qualité du modèle en calculant le coefficient de corrélation linéaire entre y
et x2 .
4) Estimer la distance de freinage correspondant à une vitesse de 70 km/h.
Exercice 8.3 Dans une expérience de cinétique chimique, l’on a mesuré la concentration x
d’une substance chimique en fonction du temps t et obtenu les valeurs numériques sui-
vantes :
t 20 30 40 50 60 70 80
x 0.05 0.10 0.27 0.52 0.80 0.90 0.95
1) Faire le nuage de points.

2) Au vu de la forme du nuage, l’on se propose d’exprimer la grandeur

x
y = ln
1−x
comme une fonction linéaire du temps y = A + Kt où la constante K est appelée constante

de vitesse de la réaction étudiée. Déterminer les coefficients A et K par la méthode MCO.
3) Donner l’expression de x en fonction de t.
Exercice 8.4 La concentration molaire C d’une espèce chimique est mesurée au cours du
temps. On obtient les données suivantes :
t (s) 20 40 60 80 100 120

C (mol.l−1 ) 278 × 192 × 147 × 119 × 100 × 86 ×
10−3 10−3 10−3 10−3 10−3 10−3
1) Représenter les données par un nuage de points.

2) Considérons le modèle de régression linéaire C = at + b. En observant uniquement la
variation de la concentration en fonction du temps, dire quel serait le signe de a et que
vaudrait la limite de C quand t → +∞. En déduire que le modèle de régression linéaire
n’est pas réaliste.
1
3) On propose le modèle = at + b.
C
(a) Calculer la limite de C quand t → +∞. Ce modèle vous semble-t-il raisonnable ?
1
(b) En faisant le changement de variable x = C, déterminer les coefficients a et b.
(c) Prévoir la valeur de C pour t = 180.
Troisième partie
Annexe
O
LD
A
ER
.G
C
I.
107
A NNEXE A
TABLE DE LA FONCTION DE RÉPARTITION ET DES QUAN -

TILES DE LA LOI N (0, 1)
O
LD
A
ER
.G
C
I.
109
Table des valeurs de la fonction de répartition de la loi normale

centrée réduite.
Z x
1
Φ ( x ) = P( X ⩽ x ) = √ exp(−t2 /2) dt.
2π −∞
x 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.00 0.5000 0.5040 0.5080 0.5120 0.5150 0.5199 0.5239 0.5279 0.5319 0.5359
0.10 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5754
0.20 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.30 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.40 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.50 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.60 0.7258 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7518 0.7549
0.70 0.7580 0.7612 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.80 0.7881 0.7910 0.7939 0.7967 0.7996 0.8023 0.8051 0.8079 0.8106 0.8133
0.90 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.00 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.10 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.20 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.30 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.40 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.50 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9430 0.9441
1.60 0.9452 0.9463 0.9474 0.9485 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.70 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.80 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9700 0.9706
1.90 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9762 0.9767
2.00 0.9773 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.10 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.20 0.9861 0.9865 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.30 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.40 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.50 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.60 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.70 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.80 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9980 0.9980 0.9981
2.90 0.9981 0.9982 0.9983 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
Grandes valeurs de x
x 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8
Φ( x ) 0.99865 0.99903 0.99931 0.99952 0.99966 0.99977 0.99984 0.99989 0.99993
Quantiles usuels de la loi normale centrée réduite.

Pour tout p ∈ ]0, 1[, le quantile d’ordre p de la loi normale centrée réduite est Φ−1 ( p) = z tel que
P( X ⩽ z) = p.
p 0.5 0.75 0.8 0.9 0.95 0.975 0.99 0.995

Φ −1 ( p ) 0 0.67 0.84 1.28 1.64 1.96 2.33 2.58
A NNEXE B
A NNEXE POUR LES EXERCICES DU CHAPITRE 8
Exercice 8.1
5
y=ax+b
y=a*ln(x)+b
4
O
Prix au kg (y)
LD
2
A
1
ER
20 40 60 80 100 120
.G
Quantité en kg (x)
C
Exercice 8.2
I.
80
Distance de freinage (m)
60
40
20
40 60 80 100 120
Vitesse (km/h)
111
Exercice 8.3
0.8
Concentration
0.6
0.4
0.2
20 30 40 50 60 70 80
Temps
Exercice 8.4
C=1/(at+b)
0.25
C=at+b
Concentration (C)
0.20
0.15
0.10
20 40 60 80 100 120
Temps (t)
R ÉFÉRENCES BIBLIOGRAPHIQUES
[1] S. B ELHAJ & A. B EN A ÏSSA – Mathématiques pour l’informatique, Vuibert, Paris, 2013.
[2] E. C ANTONI , P. H UBER & E. R ONCHETTI – Maîtriser l’aléatoire : Exercices résolus de

probabilités et statistique, Springer, Paris, 2006.
[3] Y. D ODGE – Premiers pas en statistique, Springer, Paris, 2006.
[4] S. F ERRIGNO , D. M ARX , A. M ULLER -G UEUDIN , F. B ERTRAND & M. M AUMY-

B ERTRAND – Mathématiques pour les sciences de l’ingénieur, Dunod, 2013.
O
[5] D. F REDON , M. M AUMY-B ERTRAND & F. B ERTRAND – Mathématiques : Statistique et
LD
probabilités en 30 fiches, Dunod, 2009.
[6] C. G AUTIER , A. WARUSFEL , B. C AMINADE & S. N ICOLAS – Mathématiques «tout-en-

A
un» ECS 2e année : Cours et exercices corrigés, Dunod, 2008.

ER
[7] K. E. G NEYOU – « Probabilités et Statistique », 2017, Notes de cours, Université de

Lomé (Togo).
.G
[8] J.-P. L ECOUTRE – Statistique et probabilités : Travaux dirigés, 4ème éd., Dunod, 2008.
[9] — , Statistique et probabilités (cours et exercices corrigés), 6ème éd., Dunod, 2016.
C
[10] G. S APORTA – Probabilités, analyse de données et Statistique, 2e éd., Editions Technip,

I.
Paris, 2006.
[11] B. T RIBOUT – Statistique pour économistes et gestionnaires, Pearson, Paris, 2007.
[12] R. V EYSSEYRE – Statistique et probabilités pour l’ingénieur, 2e éd., Dunod, Paris, 2006.
[13] L. WASSERMAN – All of Statistics, Springer, 2003.
113

MTH160

Transféré par

Droits d'auteur :

Formats disponibles

MTH160

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

MTH160

Transféré par

Droits d'auteur :

Formats disponibles

MTH160

Calcul de probabilités et statistique

Issa Cherif GERALDO

1 Ensembles finis et Analyse combinatoire 9

1.2.5 Arrangements sans répétition - Permutations . . . . . . . . . . . . . . . 16

1.2.6 Combinaisons sans répétition . . . . . . . . . . . . . . . . . . . . . . . . 16

2 Phénomènes aléatoires et modèle probabiliste 21

2.1 Notion d’expérience aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.2.1 Notion d’événement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3 Probabilité conditionnelle et indépendance 31

3.3 Formules importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

4 Généralités sur les variables aléatoires 39

5 Lois discrètes et continues usuelles 49

6 Concepts fondamentaux de la statistique 67

7 Séries statistiques à une variable 73

8 Séries statistiques à deux variables 93

8.4.1 Notion d’ajustement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

8.4.3 Qualité de l’ajustement par MCO . . . . . . . . . . . . . . . . . . . . . . 101

8.5.1 Ajustement par une fonction puissance . . . . . . . . . . . . . . . . . . 103

8.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

III Annexe 107

A Table de la f.r. et des quantiles de la loi N (0, 1) 109

B Annexe pour les exercices du chapitre 8 111

Références bibliographiques 113

E NSEMBLES FINIS ET A NALYSE COMBINATOIRE

1.2.3 Principe d’addition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.2.5 Arrangements sans répétition - Permutations . . . . . . . . . . . . . 16

1.1 E NSEMBLES FINIS

1.1.2 Opérations sur les ensembles finis et calcul de cardinaux

Définition 1.6 Soient Ω un ensemble et A, B deux parties de Ω.

4) Le complémentaire de A dans Ω, noté A, est l’ensemble des éléments de Ω n’appartenant

6) La différence symétrique de A et B, notée A∆B, est l’ensemble des éléments appartenant à

Illustrons les différentes définitions à l’aide d’un diagramme d’Euler-Venn.

F IGURE 1.2 – Représentation de A ∩ B pour deux ensembles A et B

F IGURE 1.3 – Représentation de A ∪ B pour deux ensembles A et B

F IGURE 1.4 – Représentation du complémentaire

F IGURE 1.5 – Représentation de la différence de deux ensembles

F IGURE 1.6 – Représentation de la différence symétrique de deux ensembles

Théorème 1.8 (Lois de De Morgan 3 ) Soient Ω un ensemble et A, B deux parties de Ω. Alors :

A∪B = A∩B et A ∩ B = A ∪ B. (1.1)

Théorème 1.9 Soit Ω un ensemble fini et soient A et B des parties de Ω.

Card( A ∪ B) = Card( A) + Card( B) − Card( A ∩ B).

3) Card( A) = Card(Ω) − Card( A).

Lorsque A = B, le produit cartésien A × B est noté A2 .

de 1 à 6. Le résultat d’un lancer est de la forme ( x1 , x2 ) où x1 (resp. x2 ) représente le chiffre

On peut généraliser le produit à cartésien à un nombre fini quelconque d’ensembles.

Définition 1.13 Soient n ∈ N∗ et E1 , . . ., En des ensembles. Pour tous x1 ∈ E1 , . . ., xn ∈

En , l’élément ( x1 , . . . , xn ) est un n−uplet et on note E1 × · · · × En l’ensemble de tous ces

Card( E1 × E2 × · · · × En ) = Card( E1 ) × Card( E2 ) × · · · × Card( En ). (1.2)

1.2 F ORMULES CLASSIQUES D ’ ANALYSE COMBINATOIRE

1.2.2 Principe multiplicatif

Ai ∩ A j = ∅ dès que i ̸= j. Alors, on a l’égalité

que l’on peut réécrire plus simplement

Application 1.22 Soit Ω = { A, B, C, D, E}. Combien de mots de 3 lettres constitués unique-

1.2.4 Arrangements avec répétition

1.2.5 Arrangements sans répétition - Permutations

Application 1.26 Une compétition réunit 16 équipes. Un podium est un triplet ( x1 , x2 , x3 )

Définition 1.27 (Permutation) Lorsque p = n, un arrangement de p éléments parmi n est

Proposition 1.29 Soit n ∈ N∗ . Le nombre de permutations possibles de n éléments distincts vaut :

et est noté n! (lire « factorielle n »). Par convention, 0! = 1.