MTH160
MTH160
MTH160
O
LD
A
ER
Mars 2023
2 MTH160 : Cours et exercices (I. C. GERALDO)
TABLE DES MATIÈRES
I Calcul de probabilités 7
O
1.2 Formules classiques d’analyse combinatoire . . . . . . . . . . . . . . . . . . . . 14
1.2.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
LD
1.2.2 Principe multiplicatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2.3 Principe d’addition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2.4 Arrangements avec répétition . . . . . . . . . . . . . . . . . . . . . . . . 15
A
3
4 MTH160 : Cours et exercices (I. C. GERALDO)
II Statistique descriptive 65
O
8.2.1 Cas des données non groupées . . . . . . . . . . . . . . . . . . . . .
LD . . 95
8.2.2 Cas des tableaux de contingence (données groupées) . . . . . . . . . . 96
8.3 Représentation graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
8.4 Ajustement linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
A
O
Calcul de probabilités
LD
A
ER
.G
C
I.
7
C HAPITRE 1
Résumé – Ce chapitre rappelle quelques propriétés des ensembles finis ainsi que les for-
mules classiques d’analyse combinatoire généralement présentées en classe de Terminale et
qui seront très utiles dans la suite du cours. L’objectif est de savoir résoudre les problèmes
classiques d’analyse combinatoire en utilisant la formule adaptée.
Sommaire
O
1.1 Ensembles finis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
LD
1.1.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.2 Opérations sur les ensembles finis et calcul de cardinaux . . . . . . 10
1.2 Formules classiques d’analyse combinatoire . . . . . . . . . . . . . . . . . 14
A
1.2.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2.2 Principe multiplicatif . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
ER
1.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
I.
Définition 1.1
• Un ensemble Ω est une collection d’objets appelés éléments de l’ensemble. On écrit
x ∈ Ω si x est élément de Ω et x ̸∈ Ω sinon.
• On admet l’existence de l’ensemble vide noté ∅ et qui ne contient aucun élément.
On représente souvent les ensembles par des diagrammes dits de Venn 1 ou d’Euler-
Venn 2 (voir Figure 1.1).
1. John Venn (1834-1923), mathématicien et logicien britannique
2. Leonhard Euler (1707-1783), mathématicien et physicien suisse
9
10 MTH160 : Cours et exercices (I. C. GERALDO)
A B
F IGURE 1.1 – Exemple de représentation de deux ensembles A et B à l’aide des diagrammes de Venn
Définition 1.2
• On dit qu’une ensemble Ω est fini s’il est vide ou s’il peut être mis en relation avec un
ensemble de numéros de la forme {1, . . . , n} (n ∈ N∗ ) de sorte qu’à chaque élément
de E corresponde un unique numéro et qu’à chaque numéro corresponde un unique
élément de Ω.
• Dans ce cas, le nombre n est appelé le cardinal de Ω noté Card(Ω) avec la convention
Card(∅) = 0.
• Un ensemble non fini est dit infini.
Exemple 1.3 L’ensemble des lettres minuscules Ω = { a, b, c, d} est fini de cardinal 4 alors
que l’ensemble N des entiers naturels et l’ensemble R des nombres réels sont des ensembles
infinis.
Définition 1.4 Soit Ω un ensemble. Un ensemble A est un sous-ensemble (ou une partie) de
Ω si tout élément de A est nécessairement élément de Ω. On note A ⊂ Ω. L’ensemble des
parties de Ω est noté P (Ω). En d’autres termes,
A ∈ P (Ω) si et seulement si A ⊂ Ω.
Par convention, l’ensemble vide ∅ est inclus dans tous les ensembles.
n o
Exemple 1.5 Si Ω = { a, b} alors P (Ω) = ∅, { a}, {b}, { a, b} .
A∆B = ( A ∪ B) \ ( A ∩ B) = ( A ∩ B) ∪ ( B ∩ A).
O
A A∩B LD B
A
A B
C
A ∪ B (en gris)
I.
E A A
Remarque 1.7 On peut étendre les notions d’intersection et de réunion à une famille consti-
tuée de plus de deux ensembles. Soient A1 , A2 , . . . , An des ensembles.
12 MTH160 : Cours et exercices (I. C. GERALDO)
A A\B B
A A\B B\A B
n
[
1) La réunion de A1 , A2 , . . . , An notée A1 ∪ A2 ∪ · · · ∪ An ou encore Ai est l’ensemble
i =1
des éléments appartenant à l’un au moins des Ai .
n
\
2) L’intersection de A1 , A2 , . . . , An notée A1 ∩ A2 ∩ · · · ∩ An ou encore Ai est l’ensemble
i =1
des éléments appartenant à tous les Ai .
Le théorème suivant donne une propriété très utile dans la manipulation des ensembles.
Donnons à présent quelques règles de calcul des cardinaux d’ensembles obtenus suite à
des opérations sur des ensembles finis de cardinaux connus.
Application 1.10 Dans une population comptant 1 000 individus, 650 personnes parlent
(couramment) le français, 250 parlent l’anglais et 100 personnes parlent les deux langues.
Soit Ω l’ensemble des individus de la population. On désigne par A et F respectivement les
ensembles d’individus parlant l’anglais et le français. Traduire les hypothèses de l’énoncé
et déterminer le nombre d’individus :
1) parlant au moins l’une des deux langues ;
2) ne parlant pas l’anglais ;
3) ne parlant aucune des deux langues (i.e. ni le français ni l’anglais) ;
4) parlant le français mais pas l’anglais ;
5) parlant une seule des deux langues.
Définition 1.11 Soient A et B deux ensembles. On appelle produit cartésien de deux en-
sembles A et B, noté A × B, l’ensemble des couples ( a, b) tels que a ∈ A et b ∈ B c’est-à-dire
O
A × B = {( a, b) | a ∈ A et b ∈ B}.
obtenu sur la face supérieure du premier (resp. second) dé. Comme x1 ∈ {1, . . . , 6} et x2 ∈
{1, . . . , 6}, l’ensemble des résultats est donc le produit cartésien {1, . . . , 6}2 .
.G
E1 × · · · × En = {( x1 , . . . , xn ) | x1 ∈ E1 et . . . et xn ∈ En }.
Exemple 1.14 Considérons les numéros de téléphone formés de 8 chiffres dont chaque
chiffre peut prendre les valeurs entières de 0 à 9. Un numéro de téléphone peut être consi-
déré comme un 8−uplet ( x1 , x2 , . . . , x8 ) où xi (i = 1, . . . , 8) représente le ième chiffre du
numéro. L’ensemble des numéros est le produit cartésien {0, 1, 2, . . . , 9}8 .
Théorème 1.15 Soient n un entier naturel non nul et E1 , . . ., En des ensembles finis. Alors,
Application 1.16 Combien y a-t-il de numéros de téléphone formés de 8 chiffres dont chaque
chiffre peut prendre les valeurs entières de 0 à 9 ?
14 MTH160 : Cours et exercices (I. C. GERALDO)
1.2.1 Généralités
L’analyse combinatoire est une branche des mathématiques qui étudie comment comp-
ter les dispositions que l’on peut former à l’aide des éléments d’un ensemble fini. Une dispo-
sition est un ensemble d’éléments pris parmi les éléments étudiés. Deux critères importants
sont utilisés pour distinguer les dispositions : l’ordre et la répétition.
Définition 1.17
1) Une disposition est dite ordonnée lorsque l’ordre des éléments qui la composent est im-
portant. Elle est dite non-ordonnée sinon. Une disposition ordonnée contenant n éléments
est encore appelée n−uplet.
2) Une disposition est dite sans répétition lorsqu’un élément y apparaît au plus une fois. Elle
est dite avec (possibilité de) répétition sinon.
3) Une disposition non-ordonnée est appelée une combinaison et une disposition ordonnée
est appelée un arrangement.
Exemple 1.18
1) Dispositions ordonnées (arrangements) avec répétition : caractères d’une plaque miné-
ralogique, un numéro de téléphone, un mot de passe, un code, les numéros issus d’un
tirage de loterie, . . .
2) Dispositions ordonnées (arrangements) sans répétition : le classement d’une compéti-
tion, les membres composant un comité (les postes étant deux à distincts et le cumul de
postes étant interdit), . . .
3) Dispositions non-ordonnées (combinaisons) sans répétition : la liste des équipes quali-
fiées pour la phase finale de la coupe du monde, la liste des étudiants assidus au cours,
...
4) Dispositions non-ordonnées (combinaisons) avec répétition : distribution d’objets à des
personnes (chacun pouvant se servir plusieurs fois), . . .
Remarque 1.19 Dans la suite du cours, les dispositions ordonnées seront notées avec des
parenthèses et celles non-ordonnées sans répétition seront notées avec des accolades. Les
dispositions non ordonnées avec répétition seront notées avec des crochets et ne doivent
pas être confondues avec les intervalles. Par exemple, soit Ω = { a, b, c, d}. Alors
(a) (d, a, b, c, a, b, a, d) est une disposition ordonnée de 8 éléments avec répétition ;
(b) [ a, a, b, c, a, b, a, d] est une disposition non-ordonnée de 8 éléments avec répétition ;
(c) (d, a, b) est une disposition ordonnée de 3 éléments sans répétition ;
(d) { a, b} est une disposition non-ordonnée de 2 éléments sans répétition.
Chapitre 1. Ensembles finis et Analyse combinatoire 15
Application 1.20 Une assemblée élit son bureau composé d’un président, d’un trésorier et
d’un secrétaire. Le cumul de poste étant interdit, combien de bureaux peut-on former :
1) avec huit candidats (en supposant que chaque candidat est éligible à tous les postes) ?
2) sachant qu’il y a deux candidats pour le poste de président, trois pour le poste de tréso-
rier et trois pour le poste de secrétaire ?
O
1.2.3 Principe d’addition
LD
Il permet de compter le nombre de dispositions lorsque l’on raisonne par cas.
Proposition 1.21 (Principe d’addition) Soient n un entier naturel tel que n ⩾ 2 et A1 , A2 , . . .,
A
An des ensembles finis deux à deux disjoints c’est-à-dire que pour tous i, j ∈ {1, . . . , n}, on a
ER
n
[ n
Card Ai = ∑ Card( Ai ).
i =1 i =1
I.
Application 1.24 Soit Ω = {1, 2, 3, 4, 5}. Combien de nombres de trois chiffres peut-on for-
mer avec les éléments de Ω ?
16 MTH160 : Cours et exercices (I. C. GERALDO)
Exemple 1.28 Les permutations possibles de trois éléments A, B et C sont ABC, ACB, BAC,
BCA, CAB et CBA.
Ann = n × (n − 1) × · · · × 1
| {z }
n facteurs
Application 1.30 De combien de façons peut-on faire asseoir 5 personnes dans une rangée
de 5 chaises ?
1.2.6.2 Propriétés
O
n n
LD
( x + y)n = ∑ Cnk xk yn−k = ∑ Cnk xn−k yk . (1.4)
k =0 k =0
A
Proposition 1.36 Soit Ω un ensemble fini tel que Card(Ω) = n. Le nombre total de parties de Ω
est :
Card(P (Ω)) = 2n .
.G
n n
Card(P (Ω)) = Cn0 + Cn1 + · · · + Cnn = ∑ Cnk = ∑ Cnk (1)k (1)n−k
k =0 k =0
n
= (1 + 1) d’après la formule du binôme de Newton
n
=2 .
1.3 E XERCICES
Exercice 1.1
1) Soient X, Y, A, B et C des sous-ensembles d’un ensemble Ω. En utilisant l’expression de
Card( X ∪ Y ), montrer que
Exercice 1.2
1) On dispose de trois tiroirs notés A, B, C dans lesquels on doit ranger à sa guise 7 objets
discernables numérotés 1 à 7. On suppose que chaque tiroir est suffisamment grand pour
O
contenir tous les objets. Combien de rangements différents peut-on faire ?
LD
2) On dispose cette fois-ci de 3 objets discernables notés 1, 2, 3 et de 5 tiroirs notés A, B, C, D,
E mais l’on ne veut pas ranger deux objets dans un même tiroir. Combien de rangements
différents peut-on faire ?
A
ER
Exercice 1.3 On suppose que les numéros de téléphone à 8 chiffres peuvent comporter à
chaque position n’importe quel chiffre de 0 à 9. Combien de numéros de téléphone peut-on
former :
.G
1) au total ?
2) si les chiffres sont deux à deux distincts ?
C
Exercice 1.6 Le tiercé est une forme de pari qui consiste à donner les trois premiers che-
vaux ayant franchi la ligne d’arrivée. Quinze (15) chevaux sont au départ d’un grand prix.
Combien y a-t-il de tiercés possibles :
1) au total ?
2) dans lesquels les 3 chevaux de tête sont prédits dans l’ordre ?
3) dans lesquels les 3 chevaux de tête sont prédits dans l’ordre ou le désordre ?
4) dans lesquels les 3 chevaux de tête sont prédits dans le désordre ?
Exercice 1.7 Lors d’un recrutement pour 4 postes identiques, 6 femmes et 8 hommes se
présentent. Combien de recrutements distincts sont possibles
1) au total ?
2) sachant que l’on embauche 2 hommes et 2 femmes ?
Exercice 1.8 Un facteur dispose de p enveloppes à répartir dans n boîtes aux lettres. On
suppose qu’une boîte peut contenir plusieurs enveloppes. De combien de façons peut se
faire cette répartition :
1) si les enveloppes sont distinctes ?
2) si les enveloppes sont identiques ?
Exercice 1.9 Une multinationale décide de lancer un dentifrice pour chien. Le nom de ce
nouveau produit doit comporter 3 lettres de l’alphabet. Déterminer les nombres :
1) N1 de noms que l’on peut fabriquer
2) N2 de noms contenant trois lettres distinctes
3) N3 de mots commençant et finissant par une consonne
4) N4 de mots contenant au moins une voyelle
5) N5 de mots contenant deux consonnes et une voyelle.
Exercice 1.10
1) Montrer que le nombre de façons de répartir n personnes en trois groupes de n1 , n2 et n3
personnes respectivement tels que n1 + n2 + n3 = n est égal à
n!
.
n1 !n2 !n3 !
2) Dans un commissariat, huit (08) agents de police sont répartis aléatoirement de telle
sorte qu’il y ait 3 agents de patrouille, 2 agents de garde au commissariat et 3 agents de
réserve. Quel est le nombre total de répartitions possibles ?
C HAPITRE 2
Sommaire
O
2.1 Notion d’expérience aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2 Evénements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
LD
2.2.1 Notion d’événement . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.2 Langage des événements . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3 Espaces probabilisés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
A
Les phénomènes dans lesquels apparaît souvent l’effet du hasard sont d’un grand inté-
I.
rêt dans plusieurs domaines très différents. A titre d’exemples, on peut citer les jeux de ha-
sard, les banques et la finance (arrivée des clients à un guichet, évaluation des capacités d’un
individu pris au hasard à rembourser un crédit avant de le lui octroyer, gestion de porte-
feuille par les compagnies boursières), la biologie (où le hasard est omniprésent et considéré
comme source de la diversité biologique des individus et de la variabilité des caractères),
la médecine (où on évalue les « chances » de succès de divers traitements), l’électronique
(durée de vie des composantes électroniques), l’informatique (théorie des graphes, filtrage
de spams, théorie des files d’attente et des réseaux), l’assurance (évaluation des risques de
sinistres, primes payées par les assurés), etc. . .
Définition 2.1
• Une expérience aléatoire est une expérience dont il est impossible de prévoir le résul-
tat, c’est-à-dire, qui répétée dans des conditions identiques, peut donner des résultats
différents.
21
22 MTH160 : Cours et exercices (I. C. GERALDO)
• L’ensemble des résultats possibles, souvent noté Ω, est appelé univers des possibles (ou
tout simplement univers) ou encore espace fondamental.
Exemple 2.2 Voici quelques exemples d’expériences aléatoires et les univers qu’on peut
leur associer :
Bien que le résultat précis d’une expérience aléatoire soit imprévisible, l’observation et
l’intuition amènent à penser que ces phénomènes obéissent à certaines lois. La théorie des
probabilités vise à fournir un modèle mathématique pour décrire ces phénomènes. Un modèle
associé à une expérience aléatoire contient trois objets mathématiques essentiels :
• l’espace fondamental Ω,
• une classe A de sous-ensembles de Ω appelés événements,
• une probabilité P sur l’espace (Ω, A), c’est-à-dire l’affectation d’un poids à chaque
événement traduisant la « chance » de réalisation dudit événement.
2.2 E VÉNEMENTS
2.2.1 Notion d’événement
La théorie des probabilités utilise le langage des ensembles pour modéliser une expé-
rience aléatoire. Dans toute la suite, nous considérerons une expérience aléatoire d’univers
Ω.
Définition 2.3
• Un événement A est une propriété dont on peut dire si elle est vraie ou non, une fois
l’expérience accomplie. On dira que l’événement A est réalisé ou non suivant que la
propriété est vraie ou fausse une fois l’expérience accomplie.
• Un événement A est aussi identifié à l’ensemble, encore noté A, de tous les éléments
de Ω pour lesquels ladite propriété est vraie. Si A est l’ensemble associé à un événe-
ment et si le résultat de l’expérience ω ∈ A alors ledit événement est dit réalisé.
Chapitre 2. Phénomènes aléatoires et modèle probabiliste 23
Exemple 2.4 On jette un dé. Soit A l’événement « le résultat obtenu est pair ». L’univers des
possibles est Ω = {1, 2, 3, 4, 5, 6}. L’événement A correspond à l’ensemble A = {2, 4, 6}. Si
l’expérience donne comme résultat 2 alors A est réalisé mais si le résultat est 5 alors A n’est
pas réalisé.
TABLE 2.2 – Tableau de correspondance entre le langage des événements et celui des ensembles
O
Evénement élémentaire Singleton {ω }
Evénement contraire de A Complémentaire de A A
LD
A et B Intersection de A et B A∩B
A ou B (ou non exclusif) Réunion de A et B A∪B
A
Remarque 2.6 Les opérations sur les événements peuvent bien sûr faire intervenir plus de
deux événements. Ainsi, si A1 , . . . , An sont des événements,
n
[
A i = A1 ∪ A2 ∪ · · · ∪ A n
i =1
est l’ensemble des éléments qui sont dans l’un au moins des Ai . C’est donc l’événement
De même :
n
\
A i = A1 ∩ A2 ∩ · · · ∩ A n
i =1
est l’ensemble des éléments qui sont dans tous les Ai . C’est donc l’événement
24 MTH160 : Cours et exercices (I. C. GERALDO)
Application 2.7 Soit A, B, C trois événements associés à une même expérience aléatoire.
Traduire en termes ensemblistes (en utilisant uniquement les symboles d’union, d’intersec-
tion et de passage au complémentaire, ainsi que A, B et C) les événements suivants :
1) Seul A se réalise ;
2) A et B se réalisent mais pas C ;
3) les trois événements se réalisent ;
4) au moins l’un des trois événements se réalise ;
5) aucun ne se réalise ;
6) exactement deux des trois se réalisent.
Exemple 2.10 Reprenons l’exemple du lancer d’un dé à six faces dont l’univers des pos-
sibles est Ω = {1, 2, 3, 4, 5, 6}. Alors,
• les événements A = {1, 3, 5} (le résultat est impair) et A = {2, 4, 6} (le résultat est
impair) forment un système complet d’événements ;
• les événements C = {1, 2} (le résultat est inférieur ou égal à 2) et D = {3, 4, 5, 6} (le ré-
sultat est strictement supérieur à 2) forment aussi un système complet d’événements.
Définition 2.11 On appelle tribu sur Ω, tout sous-ensemble A de P (Ω) vérifiant les trois
propriétés suivantes :
Chapitre 2. Phénomènes aléatoires et modèle probabiliste 25
1) Ω ∈ A ;
2) si A ∈ A alors A ∈ A (stabilité par passage au complémentaire) ;
∞
[
3) si ( Ai )i∈N est une suite d’événements de A, alors Ai ∈ A (stabilité par l’union dé-
i =1
nombrable).
Le couple (Ω, A) est alors appelé espace probabilisable.
Remarque 2.13 Dans les exemples et exercices donnés dans la suite du cours, et sauf men-
tion contraire, nous supposerons A = P (Ω).
O
Définition 2.14 (Probabilité) On appelle probabilité sur un espace probabilisable (Ω, A),
toute application P définie de A dans [0, 1] telle que :
LD
1) P(Ω) = 1 ;
2) pour toute suite ( Ai )i∈N d’événements deux à deux incompatibles :
A
!
∞
[ ∞
ER
P Ai = ∑ P( A i ). (σ − additivité de P)
i =0 i =0
G
probabilité.
2.3.2 Propriétés
Théorème 2.15 Soit (Ω, A, P) un espace probabilisé. Les propriétés suivantes sont satisfaites :
1) Pour tout A ∈ A, on a : P( A) ∈ [0, 1].
2) P(∅) = 0.
3) Pour tous événements A1 , . . . , An deux à deux incompatibles, on a :
!
n
[ n
P Ai = ∑ P( A i ).
i =1 i =1
P( A ∪ B ) = P( A ) + P( B ).
26 MTH160 : Cours et exercices (I. C. GERALDO)
P( A ∪ B ) = P( A ) + P( B ) − P( A ∩ B ). (2.1)
P( A \ B ) = P( A ) − P( A ∩ B ) (2.2)
P( A∆B) = P( A \ B) + P( B \ B). (2.3)
7) Si A, B ∈ A et si A ⊂ B, alors P( A) ⩽ P( B).
La théorie des probabilités ne dit pas quelle loi de probabilité mettre sur un ensemble Ω
parmi toutes les nombreuses lois possibles. Nous présentons ici l’équiprobabilité ou proba-
bilité uniforme mais évidemment il existe bien d’autres façons de définir une loi de proba-
bilité, chacune ayant des avantages et des limites. Quelque soit la loi choisie, il faut garder
à l’esprit qu’un modèle probabiliste n’est qu’une représentation de la réalité et ses hypo-
thèses doivent être mises à l’épreuve des faits.
1
P({ωi }) = , ∀i = 1, . . . , n. (2.4)
n
Exemple 2.17 Si l’expérience aléatoire consiste à jeter un dé parfait (non truqué) à six faces
numérotées de 1 à 6, on peut supposer que toutes les faces ont la même probabilité d’appa-
raître qui égale à 1/6.
Le calcul des probabilités n’est donc plus qu’une affaire de dénombrement, d’où la cé-
lèbre formule suivante.
Application 2.19 Dans une urne contenant dix boules indiscernables au toucher numéro-
tées de 0 à 9, on tire successivement trois boules avec remise et on relève dans l’ordre les
trois chiffres obtenus. Décrire le triplet (Ω, A, P) associé à cette expérience et calculer la
probabilité de chacun des évènements suivants :
1) A : « Les trois chiffres obtenus sont identiques ».
2) B : « Les trois chiffres obtenus sont deux à deux distincts ».
3) C : « On n’obtient pas le chiffre 4 ».
4) D : « On obtient le chiffre 4 au moins une fois ».
5) E : « Le second chiffre est pair ».
6) F : « Les deux premiers chiffres sont pairs ».
7) G : « L’un des deux premiers chiffres au moins est pair ».
O
LD
A
ER
.G
C
I.
28 MTH160 : Cours et exercices (I. C. GERALDO)
2.5 E XERCICES
Exercice 2.1 Trois boules sont tirées successivement d’une urne contenant des boules blanches
et des boules rouges. Pour tout i ∈ {1, 2, 3}, on définit l’événement :
Exercice 2.2 On procède à deux jets consécutifs d’un dé parfaitement équilibré dont les
faces sont numérotées de 1 à 6 et on relève à chaque fois le numéro obtenu sur la face su-
périeure du dé. On considère ensuite les deux événements : A « la somme des numéros
obtenus est impaire » ; B « le numéro 1 est obtenu au moins une fois ». Calculer les probabi-
lités des événements : A, B, A ∩ B, A ∪ B, A ∩ B.
Exercice 2.3 On relève les dates d’anniversaire dans un groupe de 30 personnes (jours nu-
mérotés de 1 à 365). On suppose que les jours de naissance sont équiprobables. Quelle est
la probabilité que deux personnes au moins aient le même anniversaire ?
Exercice 2.4 Une entreprise a ses sites de productions répartis sur trois pays : A, B et C.
Cette entreprise a 4 sites de production dans le pays A, 6 dans le pays B et 9 dans le pays C.
On cherche à sélectionner trois sites pour y installer des centres de recherche.
1) De combien de façons peut-on choisir ces trois sites ?
2) Quelle est la probabilité que chaque pays dispose d’un centre de recherche ?
3) Quelle est la probabilité qu’un seul pays dispose de tous les centres de recherche ?
Exercice 2.5 On effectue cinq lancers d’un dé cubique parfaitement équilibré dont les faces
sont numérotées de 1 à 6. On relève les numéros obtenus sur les faces supérieures du dé.
Déterminer la probabilité des événements suivants :
1) A : « on n’a pas obtenu la face 6 ».
2) B : « on a obtenu exactement une seule fois la face 6 ».
3) C : « on a obtenu au moins deux fois la face 6 ».
4) D : « on a obtenu 1 pour la première fois au cinquième lancer ».
5) E : « on a obtenu exactement deux fois la face 6 ».
6) F : « on a obtenu exactement deux fois la face 6 et une fois la face 4 ».
Chapitre 2. Phénomènes aléatoires et modèle probabiliste 29
Exercice 2.6 Trois personnes vont au cinéma. Il passe trois films différents. Chaque per-
sonne choisit son film au hasard sans tenir compte du choix des autres. Quelle est la proba-
bilité que :
1) les trois personnes aient vu les trois films différents ?
2) les trois personnes aient vu le même film ?
3) deux personnes exactement aient vu le même film ?
4) au moins deux personnes aient vu le même film ?
Exercice 2.7 Dix-huit (18) personnes se sont présentées à une collecte de sang. Parmi celles-
ci, on a noté : 11 personnes du groupe O, 4 personnes du groupe A, 2 personnes du groupe
B et 1 personne du groupe AB. A l’issue de la collecte, on prélève au hasard 3 flacons parmi
les 18 flacons obtenus. Calculer la probabilité des événements suivants :
1) E1 = « les 3 flacons appartiennent au même groupe »
2) E2 = « parmi les 3 flacons prélevés, il y a au moins un flacon contenant du sang du groupe
A»
O
3) E3 = « les sangs des 3 flacons appartiennent à des groupes différents »
LD
Exercice 2.8 On compose au hasard un numéro de téléphone à 8 chiffres. Quelle est la pro-
babilité pour que :
A
Exercice 2.9 On range au hasard 10 livres notés L1 , . . ., L10 sur une étagère. Quelle est la
C
probabilité p pour que 3 livres donnés (par exemple L1 , L4 et L10 ) soient rangés côte à côte ?
I.
30 MTH160 : Cours et exercices (I. C. GERALDO)
C HAPITRE 3
Sommaire
O
3.1 Introduction et définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
LD
3.2 Notion d’indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.1 Indépendance de deux événements . . . . . . . . . . . . . . . . . . 32
3.2.2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
A
Soit (Ω, A, P) l’espace probabilisé associé à une expérience aléatoire. Nous avons vu
dans le chapitre précédent que la probabilité d’un événement A ∈ A pouvait être consi-
dérée comme une quantification a priori (c’est-à-dire avant la réalisation de l’expérience)
des « chances » de réalisation de A. Si l’on dispose d’une information supplémentaire sur
la réalisation d’un autre événement B, il est logique de penser que cette nouvelle informa-
tion pourrait modifier les « chances » de voir A se réaliser. Illustrons cela à l’aide l’exemple
suivant :
Exemple 3.1 Dans un groupe de 100 personnes, il y a 40 femmes dont 10 sont au chômage
et 60 hommes dont 10 sont chômage.
1) Si on tire une personne au hasard dans la population, la probabilité qu’elle soit au chô-
mage est
20
p1 = = 0.2
100
31
32 MTH160 : Cours et exercices (I. C. GERALDO)
P( A ∩ B )
P( A | B ) = (3.1)
P( B )
est une probabilité sur (Ω, A). On l’appelle probabilité conditionnelle sachant B.
Application 3.3 On lance deux fois un dé parfaitement équilibré dont les faces sont numé-
rotées de 1 à 6. Quelle est la probabilité d’obtenir la face 6 au premier lancer sachant que la
somme des chiffres obtenus vaut 8 ?
Remarque 3.4 La probabilité conditionnelle étant avant tout une probabilité, elle vérifie
donc les propriétés données par la Proposition 2.15 (page 25).
Définition 3.5 Soit (Ω, A, P) un espace probabilisé. Deux événements A et B sont indépen-
dants pour la probabilité P s’ils vérifient la propriété :
P( A ∩ B ) = P( A )P( B ). (3.2)
Application 3.6 On lance deux fois de suite un dé parfaitement équilibré et on note les
deux chiffres obtenus. On considère les événements A : « le premier chiffre est pair » et
B : « le second chiffre est supérieur ou égal à 5 ». Vérifier que les événements A et B sont
indépendants.
Chapitre 3. Probabilité conditionnelle et indépendance 33
3.2.2 Propriétés
Proposition 3.8 Si A et B sont deux évènements indépendants alors les événements A et B, A et
B, A et B le sont aussi.
O
Exemple 3.9 On lance un dé parfaitement équilibré à six faces numérotées de 1 à 6. On
LD
considère les événements A : « le chiffre obtenu est pair » et B : « le chiffre obtenu est 5 ».
L’ensemble fondamental associé à cette expérience est Ω = {1, . . . , 6}. On peut vérifier que
A ∩ B = ∅ et
A
3 1 1
P( A ) = = et P( B) = .
ER
6 2 6
Les événements A et B sont incompatibles mais ne sont pas indépendants puisque 0 =
P( A ∩ B ) ̸ = P( A ) × P( B ).
.G
dits mutuellement indépendants si pour toute partie I de l’ensemble des indices allant de 1 à
n on a : !
\
P Ai = ∏ P( A i ).
i∈ I i∈ I
Remarque 3.11 L’indépendance mutuelle entraîne l’indépendance deux à deux mais la ré-
ciproque est fausse. En d’autres termes, l’indépendance mutuelle est beaucoup plus forte
que l’indépendance deux à deux. Par exemple, on dira que trois événements A1 , A2 et A3
sont mutuellement indépendants si les quatre égalités suivantes sont vérifiées :
P( A1 ∩ A2 ) = P( A1 )P( A2 )
P( A1 ∩ A3 ) = P( A1 )P( A3 )
P ( A2 ∩ A3 ) = P( A2 )P( A3 )
P( A1 ∩ A2 ∩ A3 ) = P( A1 )P( A2 )P( A3 ).
34 MTH160 : Cours et exercices (I. C. GERALDO)
Exemple 3.12 On lance deux fois un dé équilibré. Soient les événements A1 = « le 1er
nombre obtenu est pair », A2 = « le 2ème nombre obtenu est impair », A3 = « la somme
des deux nombres est paire ». On vérifie que Card(Ω) = 36, P( A1 ) = P( A2 ) = P( A3 ) =
18/36 = 1/2, P( A1 ∩ A2 ) = P( A1 ∩ A3 ) = P( A2 ∩ A3 ) = 1/4 et P( A1 ∩ A2 ∩ A3 ) = 0. Les
trois événements sont deux à deux indépendants mais ne sont pas mutuellement indépen-
dants.
Application 3.14 Une compagnie d’assurance assure un nombre égal de conducteurs mas-
culins et féminins. On suppose défini un espace probabilisé (Ω, A, P) où Ω est l’ensemble
des assurés. On estime la probabilité d’avoir un accident dans l’année à α = 0.3 pour un
conducteur (masculin) et β = 0.1 pour une conductrice. La compagnie sélectionne un as-
suré au hasard. On souhaite déterminer la probabilité pour que la personne sélectionnée
ait un accident pendant l’année. On considère pour cela les événements M : « La personne
sélectionnée est de sexe masculin », F : « La personne sélectionnée est de sexe féminin » et
A : « La personne sélectionnée a un accident ».
1) Calculer P( M ), P( F ), P( A| M) et P( A| F ).
2) Vérifier que F et M forment un système complet d’événements.
3) Calculer alors P( A).
Chapitre 3. Probabilité conditionnelle et indépendance 35
P( Bk ∩ A) P( A ∩ Bk ) P( A| Bk )P( Bk )
P( Bk | A) = = = .
P( A ) P( A) P( A )
En utilisant la formule (3.4), on obtient le théorème suivant qui porte le nom de formule de
Bayes 1 .
P( A| Bk )P( Bk )
∀k ∈ {1, . . . , n}, P( Bk | A) = . (3.5)
∑in=1 P( A| Bi )P( Bi )
O
LD
Exemple 3.16 Lorsque le système complet est constitué d’un événement B et son contraire
B tous deux de probabilité non nulle, la formule (3.5) se simplifie en :
P( A | B )P( B )
A
P( B | A ) = .
P( A | B )P( B ) + P( A | B )P( B )
ER
Application 3.17 Dans une usine trois machines M1 , M2 , M3 fabriquent des boulons de
.G
souhaite répondre à la question suivante : « quelle est la probabilité qu’il ait été fabriqué par
la machine M1 ? ». On considère les événements Mi : « le boulon tiré provient de la machine
I.
▶▶▶ Réponse : On pourra utiliser la formule (3.5) et vérifier que la réponse finale est 0.26.
3.4 E XERCICES
Exercice 3.1 Parmi les vols quittant une ville V1 pour une ville V2 , 89.5% partent à l’heure
(événement D) et arrivent à destination à l’heure (événement A), 3.5% partent à l’heure et
arrivent en retard, 1.5% partent en retard et arrivent à l’heure, et 5.5% partent en retard et
arrivent en retard.
1) Traduire les données de l’énoncé et expliquer pourquoi elles sont cohérentes.
2) Quelle est la probabilité
(a) qu’un vol parte à l’heure ?
(b) qu’un vol arrive en retard ?
(c) qu’un vol arrive à l’heure sachant qu’il est parti à l’heure ?
(d) qu’un vol arrivé en retard soit parti en retard ?
Exercice 3.2 On considère une communauté où chaque membre a un ordinateur sur lequel
est installé un seul système d’exploitation. On suppose que 30% des membres utilisent Ma-
cintosh, 50% utilisent Windows et 20% utilisent Linux. Au cours d’une opération sur Inter-
net, un virus informatique s’attaque à tous les PC. On apprend que ledit virus a infecté 65%
des utilisateurs de Mac, 82% des utilisateurs de Windows et 50% des utilisateurs de Linux.
On choisit une personne au hasard et on considère les événements M : « la personne pos-
sède Macintosh », W : « la personne possède Windows », L : « la personne possède Linux »,
I : « le PC de la personne est infectée par le virus ».
1) Traduire les hypothèses de l’énoncé.
2) On apprend que le système de la personne choisie a été infecté par un virus. Quelle est
la probabilité qu’elle soit un utilisateur de Windows ?
Exercice 3.3 Dans une association, deux bénévoles A et B collent des timbres sur des en-
veloppes. Le travail est réparti entre les deux bénévoles de telle sorte que A traite 40% des
enveloppes et B 60%. Sous l’effet de la fatigue, A omet de mettre un timbre dans 3% des cas
et B dans 2% des cas. On choisit une enveloppe au hasard.
1) Calculer la probabilité qu’elle ne porte pas de timbre.
2) Sachant qu’elle ne porte pas de timbre, calculer la probabilité qu’elle ait été traitée par
A.
Exercice 3.4 On considère une population composée de 48% d’hommes et de 52% de femmes.
La probabilité qu’un homme soit daltonien est 0.05, la probabilité qu’une femme soit dal-
tonienne est 0.0025. On choisit une personne au hasard dans la population. Quelle est la
probabilité qu’elle soit daltonienne ?
Exercice 3.6 On jette deux dés parfaitement équilibrés dont les faces sont numérotées de 1
à 6. Soit A l’événement « la somme des chiffres indiqués est impaire » et soit B l’événement
« l’un des dés indique le chiffre 1 ». Les événements A et B sont-ils indépendants ?
Exercice 3.7 On dispose de deux urnes contenant des boules indiscernables au toucher.
L’urne 1 contient trois boules blanches et une boule noire. L’urne 2 contient une boule
blanche et deux boules noires. On lance un dé non truqué. Si le dé donne un numéro in-
férieur ou égal à 2, on tire une boule dans l’urne 1. Sinon on tire une boule dans l’urne 2.
On considère les événements B : « la boule tirée est blanche » et Ui : « la boule est tirée dans
l’urne i », i ∈ {1, 2}.
1) Calculer les probabilités P(U1 ), P(U2 ), P( B|U1 ) et P( B|U2 ).
2) Calculer la probabilité de tirer une boule blanche.
3) On suppose que la boule tirée est blanche. Calculer le probabilité qu’elle provienne de
l’urne 1 ?
Exercice 3.8 Vous contactez deux amis A et B afin de former un groupe de travail de ma-
O
thématiques. La probabilité que l’ami A accepte est de 0.2 et celle que l’ami B accepte est de
0.6. De plus, sachant que l’ami A a accepté, l’ami B acceptera avec une probabilité de 0.7.
LD
Calculer la probabilité que :
1) vos deux amis acceptent ;
A
Exercice 3.9 Un test médical pour une maladie M donne deux résultats possibles : + et −.
C
Les probabilités sont données par : P(+ ∩ M ) = 0.009, P(+ ∩ M) = 0.099, P(− ∩ M ) =
0.001 et P(− ∩ M ) = 0.891.
I.
1) Calculer P( M), P( M), P(+| M ), P(−| M ), P(+| M) et P(−| M). Les interpréter.
2) Quelle est la probabilité d’avoir la maladie sachant que le test est positif ? Ce test vous
semble-t-il fiable ?
Exercice 3.10 Trois personnes A, B et C tirent sur un oiseau. On suppose que les tirs sont
indépendants les uns des autres et que les probabilités de succès sont respectivement 70%,
50% et 90%. Calculer la probabilité que l’oiseau soit touché
1) en calculant d’abord la probabilité de l’événement contraire ;
2) en utilisant l’expression de P( A ∪ B ∪ C ).
Exercice 3.12 La proportion des pièces défectueuses dans un lot est de 0.05. Le contrôle de
fabrication des pièces est tel que :
◦ Si la pièce est bonne, elle est acceptée avec une probabilité de 0.96.
◦ Si la pièce est mauvaise, elle est refusée avec probabilité 0.98.
On choisit une pièce au hasard et la contrôle. Probabilité pour :
1) qu’il y ait une erreur de contrôle ?
2) qu’une pièce acceptée soit mauvaise ?
C HAPITRE 4
Sommaire
O
4.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2 Variables aléatoires discrètes et continues . . . . . . . . . . . . . . . . . . 40
LD
4.2.1 Variables aléatoires discrètes . . . . . . . . . . . . . . . . . . . . . . 40
4.2.2 Variables aléatoires continues . . . . . . . . . . . . . . . . . . . . . . 42
4.3 Moments d’une variable aléatoire . . . . . . . . . . . . . . . . . . . . . . . 43
A
4.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
.G
4.1 G ÉNÉRALITÉS
C
Dans ce chapitre, on considère une expérience aléatoire dont l’espace fondamental est
noté Ω. Une variable aléatoire X est une grandeur numérique inconnue dont la valeur
I.
39
40 MTH160 : Cours et exercices (I. C. GERALDO)
X −1 ( A ) = { ω ∈ Ω | X ( ω ) ∈ A }
Théorème – Définition 4.3 Soit X une v.a. réelle définie sur un espace probabilisé (Ω, A, P) à
valeurs dans un espace probabilisable ( E, E ). Alors, l’application PX définie par :
Définition 4.5 Une variable aléatoire définie sur un espace probabilisé (Ω, A, P) est dite
discrète si l’ensemble des valeurs prises par X, noté X (Ω), est fini ou dénombrable (en bijec-
tion avec N).
Exemple 4.6 Comme exemples de v.a. discrètes on peut citer : le nombre de fois que "Pile"
apparaît dans 5 lancers d’une pièce (X (Ω) = {0, 1, 2, 3, 4, 5}), le nombre de lancers néces-
saires pour obtenir "Face" pour la première fois (X (Ω) = N∗ ), le nombre d’accidents surve-
nant dans une zone donnée (X (Ω) = N), etc. . .
Définition 4.7 On appelle loi de probabilité de la v.a. discrète X, la donnée des probabilités
P( X = xk ) pour toutes les valeurs xk ∈ X (Ω) prises par X.
Chapitre 4. Généralités sur les variables aléatoires 41
Remarque 4.8 La loi de probabilité d’une v.a. discrète X à valeurs dans { x1 , x2 , . . .} est bien
définie si et seulement elle vérifie les deux relations :
∀k ⩾ 1, P( X = xk ) ⩾ 0
(4.2)
∑
P ( X = x k ) = 1.
k⩾1
Définition 4.9 On appelle fonction de répartition (f.r.) de la v.a. discrète X, la fonction définie
de R dans [0, 1] par :
FX ( x ) = P( X ⩽ x ). (4.3)
Proposition 4.10 La fonction de répartition F d’une v.a.r. X vérifie les propriétés suivantes :
1) ∀ x ∈ R, 0 ⩽ F ( x ) ⩽ 1.
2) F est une fonction croissante (au sens large), continue à droite en tout point x ∈ R.
O
3) lim F ( x ) = 0 et lim F ( x ) = 1.
x →−∞ x →+∞
LD
Remarque 4.11
1) L’ensemble de définition de la f.r. est R et non X (Ω).
A
2) En particulier, pour une v.a. discrète, la fonction de répartition est une fonction en escalier,
constante par morceaux et continue à droite.
ER
La proposition suivante est très utile pour calculer la fonction de répartition d’une v.a.
discrète.
.G
Proposition 4.12 Soit X une variable aléatoire discrète prenant un ensemble fini de valeurs { x1 , . . . , xn }
avec probabilités respectives p1 , . . ., pn telles que
C
n
∑ pi = 1.
I.
i =1
Application 4.13 On lance trois fois une pièce parfaitement équilibrée et on désigne par X
le nombre de fois que "Pile" apparaît. Déterminer la loi de probabilité et la f.r. de X.
Définition 4.14 Une v.a. X est dite absolument continue (ou à densité) s’il existe une fonction
f définie sur R, positive, continue sauf peut-être en un nombre fini de points, telle que
Z +∞
f ( x ) dx = 1 (4.5)
−∞
Exemple 4.15 Comme exemples de v.a. continues on peut citer : la durée de vie d’un té-
léphone portable (X (Ω) = R∗+ ), le temps passé dans une file d’attente devant un guichet
(X (Ω) = R∗+ ), le poids d’un individu (X (Ω) = R∗+ ), la température (X (Ω) = R), etc. . .
Définition 4.17 (Quantiles) Soit X une v.a. à densité dont la fonction de répartition est no-
tée F. Pour tout α ∈ ]0, 1[, on appelle quantile d’ordre α, le réel qα tel que
O
et la variance. LD
4.3.1 Espérance mathématique
A
Définition 4.19 Soient (Ω, A, P) un espace probabilisé et X une v.a. réelle définie sur Ω.
ER
E( X ) = ∑ xk pk (4.10)
k⩾1
C
Z +∞
E( X ) = x f ( x ) dx. (4.11)
−∞
Proposition 4.21
1) L’espérance d’une v.a. réelle est une constante réelle.
2) L’espérance mathématique est linéaire c’est-à-dire, si a désigne une constante réelle et si X,
X1 , . . . , Xn désignent des v.a., on a :
(a) E( X + a) = E( X ) + a ;
(b) E( aX ) = aE( X ) ;
44 MTH160 : Cours et exercices (I. C. GERALDO)
(c) E( X1 + · · · + Xn ) = E( X1 ) + · · · + E( Xn ).
3) L’espérance conserve le signe et l’ordre c’est-à-dire, si X et Y sont des variables aléatoires, alors
(a) si X ⩾ 0, alors E( X ) ⩾ 0 ;
(b) si X ⩽ Y, alors E( X ) ⩽ E(Y ).
Dans la pratique, il arrive qu’on ait besoin de calculer E(h( X )) où h( X ) est donnée en
fonction de X. Le résultat suivant permet de résoudre un tel problème.
Théorème 4.22 Soit X une variable aléatoire réelle définie sur un espace probabilisé (Ω, A, P).
Alors pour toute fonction h : R −→ R, l’espérance mathématique de h( X ) = h ◦ X, si elle existe,
est donnée par la règle suivante :
1) Si X est discrète et prend les valeurs x1 , x2 , . . . avec probabilités respectives p1 , p2 , . . .,
E(h( X )) = ∑ h( xk ) pk (4.12)
k⩾1
Exemple 4.23
1) Si X est discrète et prend les valeurs x1 , x2 , . . . , xn avec probabilités respectives p1 , p2 , . . .,
pn ,
n
E( X 2 ) = ∑ ( x k )2 p k (4.14)
k =1
4.3.2 Variance
Définition 4.24 Soit X une v.a. telle que E( X 2 ) existe. La variance de X est définie par :
Var( X ) = E ( X − E( X ))2 (4.16)
p
et le réel positif σ( X ) = Var( X ) est appelé écart-type de X.
Proposition 4.26 Soit X une v.a.r telle que Var( X ) existe. Alors :
Chapitre 4. Généralités sur les variables aléatoires 45
1) Var( X ) ⩾ 0.
2) Si a et b sont des constantes alors Var( aX + b) = a2 Var( X ).
Remarque 4.27 La variance peut-être utilisée comme un indicateur de dispersion. Plus elle
est élevée, plus les valeurs sont dispersées autour de la valeur moyenne.
O
LD
A
ER
.G
C
I.
46 MTH160 : Cours et exercices (I. C. GERALDO)
4.4 E XERCICES
Exercice 4.1 On lance simultanément deux dés bien équilibrés dont les faces sont numéro-
tées de 1 à 6. On note X la valeur absolue de la différence des nombres portés sur les faces
supérieures.
1) Quelle est la loi de probabilité de X ?
2) Calculer E( X ) et Var( X ).
Exercice 4.2 On lance simultanément deux dés bien équilibrés dont les faces sont numéro-
tées de 1 à 6. On note X le maximum des numéros obtenus. Déterminer la loi de probabilité
de X.
Exercice 4.3 Une urne contient 3 jetons blancs (1 carré et 2 ronds) et 4 jetons noirs (3 carrés
et 1 rond). On tire au hasard et simultanément 3 jetons de l’urne. On appelle X la v.a.r égale
au nombre de jetons blancs obtenus lors d’un tirage. Loi de X et E( X ) ?
Exercice 4.4 Dans un rayon de magasin, il y a deux produits A et B (par exemple une table
et une chaise). La probabilité pour qu’un client achète le produit A est 0.3. La probabilité
pour qu’il achète le produit B quand il a acheté le produit A est 0.8 et la probabilité qu’il
achète le produit B quand il n’a pas acheté le produit A est 0.1. Les produits A et B sont
respectivement vendus à 10 000 F et 4 000 F. La dépense du client est une v.a. X. Déterminer
la loi de X puis calculer E( X ) et Var( X ).
Exercice 4.5 Soit X une variable aléatoire (v.a.) dont la loi de probabilité est donnée par le
tableau suivant :
xi −2 −1 1 2 3
P( X = x i ) 0.6 α 0.1 0.05 0.05
1) Déterminer la valeur de α.
2) Calculez l’espérance mathématique, la variance et l’écart-type de cette distribution.
3) Soit Y = 2X − 1. Déterminer la loi de Y puis calculer son espérance et sa variance par
deux méthodes différentes.
Exercice 4.6 Soit X une v.a.r prenant les valeurs −4, −2, 0, 2 et 4 avec les mêmes probabi-
lités. Déterminer la loi de | X | et ses caractéristiques numériques (espérance mathématique,
variance et écart-type).
Exercice 4.7 On considère un dé cubique truqué dont les faces sont numérotés de 1 à 6 et on
note X la variable aléatoire donnée par le numéro de la face supérieure du dé. On suppose
que le dé est truqué de sorte que la probabilité d’obtenir une face est proportionnelle au
numéro inscrit sur cette face c’est-à-dire qu’il existe un réel a tel que P( X = k ) = ka pour
tout k ∈ {1, . . . , 6}.
1) Déterminer la loi de X et calculer son espérance mathématique.
Chapitre 4. Généralités sur les variables aléatoires 47
Exercice 4.8 Dans une loterie, il y a 100 billets de 500 F et 2 lots : l’un de 5 000 F et l’autre
de 10 000 F. Les numéros des deux billets gagnants sont tirés au sort indépendamment l’un
de l’autre (le même billet peut donc gagner les deux lots). La somme d’argent gagnée (ou
perdue) par une personne qui achète un seul billet est une v.a. X. On représentera les pertes
par des nombres négatifs : par exemple si la personne ne gagne aucun lot, elle perd 500 F,
on aura alors X = −500. Déterminer la loi de X et calculer E( X ).
Exercice 4.9 Une urne contient une boule qui porte le numéro 0, deux qui portent le numéro
1, trois qui portent le numéro 2 et quatre qui portent le numéro 3. On extrait simultanément
deux boules de cette urne et on désigne par X la somme des numéros obtenus.
1) Déterminer la loi de X.
2) Calculer son espérance et sa variance.
O
Exercice 4.10 Soit f la fonction de R vers R définie pour tout x ∈ R par :
(
LD
kx si x ∈ [0, 3]
f (x) =
0 sinon.
A
Kx (1 − x ) si 0 ⩽ x ⩽ 1
f (x) =
0 sinon
Résumé – Ce chapitre présente les lois de probabilité discrètes et continues souvent utili-
sées dans la pratique. L’objectif est de savoir faire des calculs en utilisant les lois de proba-
bilité usuelles.
Sommaire
5.1 Lois discrètes usuelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
O
5.1.1 Loi uniforme discrète . . . . . . . . . . . . . . . . . . . . . . . . . .
LD 49
5.1.2 Loi de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.1.3 Loi binomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.1.4 Loi géométrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
A
Dans tout le chapitre, on utilise le symbole ⇝ pour exprimer le fait qu’une v.a. suive
une certaine loi de probabilité.
49
50 MTH160 : Cours et exercices (I. C. GERALDO)
Définition 5.1 Soit n ∈ N∗ . Une variable aléatoire X suit une loi uniforme discrète sur
[[1, n]] si X prend ses valeurs dans l’ensemble [[1, n]] = {1, . . . , n} et si
1
∀k ∈ {1, . . . , n}, P( X = k ) = . (5.1)
n
Proposition 5.2 Si X suit une loi uniforme discrète sur [1, n], alors
n+1 n2 − 1
E( X ) = et Var( X ) = . (5.2)
2 12
Remarque 5.3 La loi uniforme discrète intervient dans de nombreux domaines comme les
jeux de pile ou face ou les jeux de dés (avec une pièce ou un dé parfaitement équilibré(e)),
les jeux de cartes, etc. . .
Définition 5.4 Soit p ∈ [0, 1]. Une variable aléatoire X suit une loi de Bernoulli de para-
mètre p et on note X ⇝ B(1, p) si la v.a. X ne peut prendre que deux valeurs 1 et 0 avec
probabilités respectives p et q = 1 − p c’est-à-dire X (Ω) = {0, 1} et
P( X = 1) = p etP( X = 0) = q = 1 − p. (5.3)
Remarque 5.6 La loi de Bernoulli B(1, p) est souvent utilisée pour modéliser une épreuve
de Bernoulli c’est-à-dire une expérience aléatoire dont le résultat ne peut prendre que deux
valeurs appelées, par convention, succès et échec. Dans ce cas, la v.a. X associée prend la
valeur 1 pour le succès et la valeur 0 pour l’échec avec probabilités respectives p et q = 1 − p.
où
n!
Cnk = .
k!(n − k )!
▶▶▶ Réponse : On pourra vérifier que le premier résultat cherché est 0.107. Le second s’en
O
déduit aisément à l’aide des opérations sur les événements.
LD
L’espérance mathématique et la variance sont données par la proposition suivante :
A
Considérons une expérience aléatoire n’ayant que deux résultats possibles : le succès
(avec probabilité p ∈ [0, 1]) et l’échec (avec probabilité q = 1 − p). Répétons cette expé-
I.
∀ k ∈ N∗ , P( X = k ) = (1 − p)k−1 p. (5.7)
1 1− p
E( X ) = et Var( X ) = . (5.8)
p p2
52 MTH160 : Cours et exercices (I. C. GERALDO)
Définition 5.10 La loi de Poisson de paramètre λ > 0, notée P (λ), est la loi d’une v.a.
discrète prenant ses valeurs dans N avec les probabilités :
e− λ λ k
∀k ∈ N, P( X = k ) = . (5.9)
k!
E( X ) = Var( X ) = λ. (5.10)
Remarque 5.12 La loi de Poisson est utilisée pour décrire les « événements rares » comme
le nombre d’appels reçus par un standard téléphonique pendant une période donnée, le
nombre de suicides par an dans un pays donné, le nombre de pièces défectueuses dans une
livraison importante (la production étant de bonne qualité), le nombre d’accidents dans un
atelier, etc. . ..
La variable aléatoire X ainsi définie suit une loi hypergéométrique dépendant de trois para-
mètres N, n et p notée H( N, n, p), où p = M/N désigne la proportion d’individus vérifiant
la propriété dans la population entière.
N−n
E( X ) = np et Var( X ) = np(1 − p). (5.12)
N−1
Chapitre 5. Lois discrètes et continues usuelles 53
Définition 5.14 Soient a et b deux réels tels que a < b. Une variable aléatoire X à valeurs
dans [ a, b] suit une loi uniforme continue sur [ a, b], notée U [ a, b], si X est une v.a. continue
et admet pour densité de probabilité, la fonction (voir Figure 5.1) définie par :
1 1 si x ∈ [ a, b]
f (x) = 1 (x) = b − a (5.13)
b − a [a,b] 0 sinon.
f (x)
O
1/(b − a)
LD
A
0 a b x
ER
(
1 si x ∈ [0, 1]
f (x) = (5.14)
I.
0 sinon.
La loi uniforme sur [0, 1] et la loi uniforme sur [ a, b] sont liées par les relations suivantes.
Proposition 5.16
X−a
1) Si X ⇝ U [ a, b], alors U = b− a ⇝ U [0, 1].
2) Si U ⇝ U [0, 1], alors X = (b − a)U + a ⇝ U [ a, b].
Proposition 5.17 Si X est une variable aléatoire de loi uniforme U [ a, b], alors
a+b ( b − a )2
E( X ) = et Var( X ) = . (5.15)
2 12
54 MTH160 : Cours et exercices (I. C. GERALDO)
Définition 5.19 Une variable aléatoire X à valeurs dans [0, +∞[ suit une loi exponentielle
de paramètre λ > 0, notée E (λ), si X est une v.a. continue et admet pour densité de proba-
bilité la fonction (voir Figure 5.2) :
(
λe−λx si x ⩾ 0
f ( x ) = λe−λx 1R+ ( x ) = (5.17)
0 si x < 0.
f (x)
0 1 2 3 4 5 x
Définition 5.22 Une v.a.r. X, prenant ses valeurs dans R, suit la loi normale (ou loi de
Gauss) de paramètres m ∈ R et σ > 0, notée N (m, σ), si sa densité de probabilité est
donnée par :
1 − ( x −m)
2
f (x) = √ e 2σ2 . (5.20)
σ 2π
Définition 5.23 La loi N (0, 1) est appelée loi normale centrée réduite ou loi normale stan-
dard. Sa densité (voir Figure 5.3) est souvent notée φ :
1 2
φ( x ) = √ e− x /2 . (5.21)
2π
O
φ( x )
LD
A
Φ(−z) = P( X ⩽ −z)
= 1 − Φ(z) Φ(−z)
ER
.G
C
−3 −2 −1 − z 0 z 1 2 3 x
I.
F IGURE 5.3 – Densité de la loi N (0, 1). La zone coloriée correspond à Φ(−z).
Définition 5.26 La fonction de répartition (f.r.) de la loi N (m, σ) est définie par :
Z x
1 − (t−m2)
2
F ( x ) = P( X ⩽ x ) = √ e 2σ dt
σ 2π −∞
56 MTH160 : Cours et exercices (I. C. GERALDO)
pour tout x ∈ R. En particulier, la f.r. de la loi N (0, 1), généralement notée Φ, est définie
par Z z
1 t2
Φ(z) = √ e− 2 dt.
2π −∞
pour tout z ∈ R.
La f.r. de la loi N (m, σ) n’a pas d’expression analytique exacte. Pour contourner ce pro-
blème, on utilise la proposition suivante qui montre que les valeurs de la f.r. d’une loi nor-
male quelconque peuvent être obtenues à partir de celles de la loi normale centrée réduite.
Proposition 5.27 Soit X une v.a. suivant la loi N (m, σ). Alors, la v.a. Z définie par
X−m
Z= (5.22)
σ
et appelée variable centrée réduite associée à X, suit la loi N (0, 1).
Cette propriété permet de ramener tous les calculs liés à la fonction de répartition d’une
loi normale quelconque à celle de la loi normale centrée réduite. En effet, supposons que X
suive une loi normale N (m, σ) et que nous voulions calculer F ( x ) = P( X < x ). Soit
X−m
Z=
σ
la variable centrée réduite associée à X. On a :
X−m x−m x−m x−m
P( X < x ) = P < =P Z< =Φ . (5.23)
σ σ σ σ
Il ne reste donc plus qu’à savoir calculer la f.r. de la loi N (0, 1). Dans ce cas, on ne
dispose pas de formule analytique exacte et l’on a plutôt recours à une table statistique
(voir page 110).
On peut remarquer que seules les valeurs Φ(z) = P( X < z) avec u positif y figurent.
On montre que la fonction de répartition de la loi N (0, 1) vérifie la proposition suivante.
Proposition 5.29 La f.r. de la loi N (0, 1) vérifie la propriété suivante :
En résumé,
• pour z ⩾ 0, la valeur de Φ(z) est donnée par la table.
• pour z < 0, on a −z > 0 et Φ(z) = 1 − Φ(−z).
P( X < b ) = Φ ( b ) (5.25)
P( X > a ) = 1 − Φ ( a ) (5.26)
P( a < X < b ) = Φ ( b ) − Φ ( a ). (5.27)
O
σ
Pour tous a et b ∈ R tels que a ⩽ b, on a :
LD
X−m b−m
P( X < b ) = P <
σ σ
A
b−m
=P Z<
σ
ER
b−m
=Φ ,
σ
.G
X−m a−m
P( X > a ) = P >
σ σ
C
a−m
=P Z>
σ
I.
a−m
= 1−Φ
σ
et
a−m X−m b−m
P( a < X < b ) = P < <
σ σ σ
a−m b−m
=P <Z<
σ σ
b−m a−m
=Φ −Φ .
σ σ
Exemple 5.30 Soit X une variable suivant la loi normale N (3, 2). Calculons les probabilités
suivantes : P( X < 4), P( X < −1), P( X > 1), P(−3 < X < 4). On sait que
X−3
Z= ⇝ N (0, 1).
2
58 MTH160 : Cours et exercices (I. C. GERALDO)
On a :
X−3 4−3
P( X < 4) = P <
2 2
= P( Z < 1/2)
= Φ(0.5)
≃ 0.6915.
X−3 −1 − 3
P( X < −1) = P <
2 2
= P( Z < −2)
= Φ(−2)
= 1 − Φ (2)
≃ 0.0227.
X−3 1−3
P( X > 1) = P >
2 2
= P( Z > −1)
= 1 − P( Z < −1)
= 1 − (1 − Φ(1))
= Φ (1)
≃ 0.8413.
−3 − 3 X−3 4−3
P(−3 < X < 4) = P < <
2 2 2
= P(−3 < Z < 1/2)
= Φ(1/2) − Φ(−3)
= Φ(1/2) − 1 + Φ(3)
≃ 0.6901.
5.2.3.6 Quantiles
Les quantiles de la loi normale N (0, 1) jouent un grand rôle en probabilité et en statis-
tique (tests d’hypothèses, construction d’intervalles de confiance, . . .).
Définition 5.31 Soit X une v.a. à densité dont la fonction de répartition est notée F. Pour
tout α ∈ ]0, 1[, on appelle quantile d’ordre α, le réel qα tel que
F (qα ) = α ou encore P( X ⩽ qα ) = α.
Les quantiles usuels de la loi normale centrée réduite sont donnés sous la forme d’une
table disponible en annexe (voir page 110). Ils vérifient la propriété fondamentale suivante :
Proposition 5.32 Soit α ∈ ]0, 1[. Notons zα le quantile d’ordre α de la loi normale centrée réduite.
Alors, on a :
z 1− α = − z α .
O
sans remise (loi hypergéométrique) à une tirage avec remise (loi binomiale).
LD
5.3.2 Approximation de la loi binomiale par une loi de Poisson
Quand n → +∞ et p → 0, on peut approximer la loi binomiale B(n, p) par une loi de
A
Poisson P (np). En pratique, cela est possible pour des valeurs très faibles de la probabilité
p (p < 0.1) et des valeurs très grandes de n (n > 50). Une illustration en est donnée par la
ER
figure 5.4.
.G
0.12
C
0.10
I.
0.08
P(X=k)
0.06
0.04
0.02
0.00
0 5 10 15 20 25 30 35
F IGURE 5.4 – Approximation de la loi B(400; 0, 03) (en bleu) par la loi P (12) (en rouge). Tous les
bâtons ne sont pas affichés (pour la loi de Poisson, il y en a une infinité). On se limite aux valeurs de
k pour lesquelles la probabilité est assez éloignée de zéro pour être visible sur le graphique.
60 MTH160 : Cours et exercices (I. C. GERALDO)
Comme il s’agit de l’approximation d’une loi discrète par une loi continue, on procède
à ce que l’on appelle correction de continuité de la façon suivante : Si X ∼ B(n, p) et si
k ∈ {1, . . . , n} alors
P( a ⩽ X ⩽ b) ≃ P( a − 0.5 ⩽ X ⩽ b + 0.5)
a − 0.5 − np b + 0.5 − np
≃P √ ⩽U⩽ √
npq npq
b + 0.5 − np a − 0.5 − np
≃Φ √ −Φ √ . (5.29)
npq npq
Exemple 5.34 Pour X ∼ B(100, 0.3), np = 30 et nq = 70, la valeur exacte de P( X = 30) est
30
P( X = 30) = C100 0.330 0.770 ≈ 0.08678.
√ √
La formule d’approximation avec une loi N (np, npq) = N (30, 21) donne le résultat :
30 + 0.5 − 30 30 − 0.5 − 30
P( X = 30) ≈ Φ √ −Φ √ ≈ 0.08688.
21 21
L’erreur d’approximation est très faible.
5.4 E XERCICES
Exercice 5.1 Vous vous livrez chaque matin (du lundi au vendredi inclus) au petit jeu sui-
vant : ayant jeté une pièce de monnaie, vous vous rendez en cours si le résultat obtenu est
« face » ; dans le cas contraire, vous restez au lit. Soit X le nombre de jours où vous avez
« gagné » le droit au repos.
1) Quelle est la loi de X ? Justifiez votre réponse.
2) Calculer E( X ) et Var( X ).
Exercice 5.2 On jette 10 pièces de monnaies truquées de telle sorte que pour chacune d’elles,
la probabilité d’obtenir "pile" soit 0.3. Soit X la v.a. égale au nombre de "piles" obtenus au
cours de ce lancer.
1) Loi de X, E( X ) et Var( X ) ?
2) Probabilité d’obtenir 3 "piles" ? moins de 3 "piles" ?
3) Probabilité que l’on ait obtenu plus de 3 piles sachant que l’on a obtenu au plus 5 "piles" ?
O
Exercice 5.3 On considère deux types d’avions A et B ayant respectivement 4 et 2 moteurs.
LD
Les moteurs sont supposés indépendants les uns des autres, et ils ont une même probabilité
p (0 < p < 1) de tomber en panne. Chaque avion arrive à destination si moins de la moitié
de ses moteurs tombe en panne (c’est-à-dire que l’avion A arrive à destination si au plus
A
un des moteurs tombe en panne et l’avion B arrive à destination si aucun des moteurs ne
ER
Exercice 5.4 Le nombre d’ordinateurs vendus chaque jour dans un magasin spécialisé suit
une loi de Poisson de paramètre 4. Calculer la probabilité que dans une journée :
1) on ne vende aucun ordinateur,
2) on vende 4 ordinateurs,
3) on vende au moins un ordinateur,
4) on vende au plus 3 ordinateurs,
5) le nombre d’ordinateurs vendus est compris entre 2 et 6.
Exercice 5.5 Soit X une v.a. de loi exponentielle E (λ) avec λ > 0.
1) Rappeler l’expression de la fonction de répartition de X.
2) Vérifier que P( X > h + t| X > h) = P( X > t). On dit que la loi exponentielle est « sans
mémoire ».
62 MTH160 : Cours et exercices (I. C. GERALDO)
3) On suppose que la durée de vie d’une clé USB suit une loi exponentielle de paramètre
λ = 1/24. L’unité de temps est le mois. Quelle est la probabilité que :
(a) la clé USB fonctionne au moins 8 mois ?
(b) la clé fonctionne encore 4 mois ou plus sachant qu’elle fonctionne toujours au bout
de 8 mois ?
Exercice 5.6
1) Quelle est la probabilité d’obtenir un double (deux mêmes nombres) lorsqu’on lance une
fois une paire de dés ?
2) On lance de façon répétée une paire de dés jusqu’à la première obtention d’un double.
Soit X la variable aléatoire égale au nombre de lancers ainsi réalisés. Donner les valeurs
de P( X = 1), P( X = 2) et plus généralement P( X = k ) où k ⩾ 1 est un entier quel-
conque. Comment s’appelle la loi de X ?
3) Soit n ⩾ 1 un nombre entier naturel. Calculer la probabilité de n’obtenir aucun double
lors des n premiers lancers. En déduire P( X > n).
4) Pour k > n, vérifier que P( X = k | X > n) = P( X = k − n). En donner une interprétation.
Exercice 5.7 Soit X une v.a. suivant la loi normale centrée réduite. Calculer P(−2 < X <
−1), P(| X | < 3), P( X < 2| X > 1.65).
Exercice 5.8 Soit X une v.a.r suivant la loi N (8, 4). Calculer P( X < 7.5), P( X > 8.5),
P(6.5 < X < 10) et P( X > 6 | X > 5).
Exercice 5.9 On suppose que la taille X des hommes suit une loi normale d’espérance 1.75
m et d’écart-type 0.07 m. On mesure la taille chez un individu.
1) Calculer la probabilité que sa taille soit
(a) inférieure à 1.54 m
(b) supérieure à 1.85 m
(c) comprise entre 1.54 m et 1.85 m.
2) On mesure la taille chez 2000 individus. On assimile la situation à un tirage avec remise
et on désigne par X le nombre d’individus dont la taille est supérieure à 1.85 m.
(a) Quelle est la loi de X ?
(b) Donner le nombre moyen d’individus dont la taille est supérieure à 1.85m.
Exercice 5.10 Dans un pays dont la population est composée de femmes à 55%, la taille (en
mètres) des adultes de sexe masculin (resp. féminin) est distribuée selon une loi normale de
moyenne 1.78 (resp. 1.72) et d’écart-type 0.14 (resp. 0.1).
1) Quelle proportion des femmes mesure moins de 1.76m ?
2) Quelle proportion des hommes mesure moins de 1.76m ?
3) Quelle est la probabilité pour qu’une personne choisie au hasard mesure moins de 1.76m ?
4) Parmi les personnes mesurant moins de 1.76m, quelle est la proportion de femmes ?
Chapitre 5. Lois discrètes et continues usuelles 63
5) Si vous choisissez une personne au hasard dans la population, quelle est la probabilité
que ce soit un homme mesurant moins de 1.76m ?
Exercice 5.11 On jette 360 fois un dé équilibré dont les faces sont numérotées de 1 à 6 et on
désigne par X le nombre d’apparitions du numéro 1.
1) Quelle est la loi exacte de X ?
2) En approximant la loi de X par une loi normale, déterminer la probabilité que le nombre
d’apparitions du numéro 1 soit compris entre 48 et 72.
O
LD
A
ER
.G
C
I.
64 MTH160 : Cours et exercices (I. C. GERALDO)
Deuxième partie
O
Statistique descriptive
LD
A
ER
.G
C
I.
65
C HAPITRE 6
Sommaire
6.1 Définition et champs d’application de la statistique . . . . . . . . . . . . 67
6.2 Vocabulaire de la statistique . . . . . . . . . . . . . . . . . . . . . . . . . . 67
O
6.2.1 Population, individus et échantillon . . . . . . . . . . . . . . . . . . 67
6.2.2 Caractères ou variables statistiques . . . . . . . . . . . . . . . . . . 69
LD
6.2.3 Série statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
6.3 Statistique descriptive et statistique inférentielle . . . . . . . . . . . . . . 72
A
exemple, les statistiques du chômage au Togo) ou encore l’ensemble des méthodes de col-
lecte, de traitement, d’analyse, d’interprétation et de présentation (diffusion) des données
afin de les rendre accessibles. Le mot « statistique » est aussi parfois utilisé pour désigner
C
Définition 6.1
67
68 MTH160 : Cours et exercices (I. C. GERALDO)
• L’ensemble Ω sur lequel porte une étude statistique est appelé la population.
• Un élément ω de cette population est appelé individu ou unité statistique.
• Le nombre n d’individus composant la population à étudier est appelé effectif total
ou taille de la population.
Il faut prêter attention au fait que les termes « population » et « individu » sont em-
ployés aussi bien lorsqu’il s’agit d’êtres humains que d’objets quelconques. Il est toujours
indispensable de bien définir la population soumise à l’étude statistique.
Exemple 6.2
• Si l’on souhaite étudier l’âge moyen des employés de banque de la ville de Lomé, la
population est l’ensemble des employés de banque de Lomé et l’unité statistique est
un employé de banque de Lomé.
• Par contre, lorsque l’on souhaite étudier le nombre d’employés des banques de la
ville de Lomé, la population est l’ensemble des banques de la ville de Lomé (et non
l’ensemble des employés de banque de la ville de Lomé) et l’unité statistique est une
banque de la ville de Lomé.
Les notions de population, individus et échantillons sont illustrées par la figure 6.1.
Individu
, , ,
, , , , ,
Population , , , , ,
, , , , ,
, , ,
Un échantillon
Définition 6.4
Chapitre 6. Concepts fondamentaux de la statistique 69
• Le statisticien fait des relevés sur les individus d’une population : ce sont les observa-
tions.
• Lorsque l’étude statistique consiste à faire des observations sur tous les individus
d’une population, on parle de recensement.
• Lorsque l’étude statistique consiste à faire des observations sur un échantillon de la
population, on parle de sondage.
L’utilisation d’un sondage plutôt que d’un recensement s’explique par le fait qu’un re-
censement dans une population de grande taille est très couteux en temps et en ressources
financières. Par exemple, lors de la campagne pour une élection présidentielle, il est souhai-
table pour les candidats d’avoir, sur une base journalière, une idée sur les intentions de vote
afin d’apprécier l’acceptation de leurs programmes par la population et de faire des ajuste-
ments si nécessaire. Mais il n’est pas possible d’interroger des millions de personnes en une
journée et ce, chaque jour. L’étude des méthodes de sélection d’un échantillon dit « repré-
sentatif » et de la généralisation des résultats obtenus sur ledit échantillon à la population
O
entière fait l’objet de la théorie des sondages et de la théorie de l’estimation.
LD
6.2.2 Caractères ou variables statistiques
A
Définition 6.5 Les caractéristiques ou propriétés étudiées sur les individus sont appelées
caractères ou variables. Mathématiquement, un caractère est une application χ de l’en-
ER
semble Ω (la population) dans l’ensemble C des valeurs possibles dudit caractère, qui asso-
cie à chaque individu ω de Ω la valeur χ(ω ) que prend ce caractère sur l’individu ω. Les
valeurs possibles d’un caractère sont appelées ses modalités.
.G
Remarque 6.6 Les modalités d’un caractère doivent être incompatibles (un individu ne
C
Les modalités d’une variable quantitative sont parfois si nombreuses que pour des rai-
sons de commodité, elles sont regroupées en classes. Par exemple, dans l’étude de l’âge des
individus d’un pays, la variable « age » peut être définie selon des tranches d’âge exprimant
70 MTH160 : Cours et exercices (I. C. GERALDO)
des modalités telles que 0-4 ans, 5-9 ans, 10-17 ans, etc. On distingue deux types de variables
quantitatives : les variables discrètes et les variables continues.
Une variable quantitative X est dite discrète si l’ensemble de ses modalités est au plus
dénombrable, c’est-à-dire si ses valeurs peuvent être énumérées sous la forme d’une liste
de chiffres x1 , x2 , . . .. Parmi les exemples de variables quantitatives discrètes, on peut citer :
le nombre d’enfants d’une famille, la répartition des étudiants togolais étudiant à l’étranger
dans les pays de l’UEMOA en 2022-2023, le nombre d’accidents mensuels sur les routes to-
golaises en 2022, etc. . ..
Une variable quantitative est dite continue si ces modalités ne sont pas au plus dénom-
brables c’est-à-dire qu’on ne peut pas les numéroter ou si ses modalités sont regroupées par
classes (intervalles de R). Une telle variable peut prendre toutes la valeurs dans un (plu-
sieurs) intervalle(s) de R. Parmi les exemples de variables quantitatives continues, on peut
citer : la taille d’une personne, le poids des individus d’une population, la durée de vie d’un
composant électronique, etc. . ..
Remarque 6.7 Pour une variable quantitative continue, le nombre de classes doit respecter
certains critères. Le nombre de classes à retenir dépend de la précision des mesures et de
la taille de la population étudiée. Il ne doit être ni trop grand (sinon le problème de départ
qui concerne l’abondance des données n’est pas résolu) ni trop petit (car il y aurait perte
d’informations).
Une variable est dit qualitative lorsque ses modalités sont des mots ou des lettres n’ex-
primant pas de quantité. Une variable qualitative n’ayant que deux modalités est dite di-
chotomique.
On distingue deux types de variables qualitatives : les variables nominales et les va-
riables ordinales.
Une variable qualitative est dite nominale si ses modalités ne sont pas ordonnées. Par
exemple on peut citer : le sexe, la couleur des yeux, le loisir préféré des individus d’une
population, la marque de voiture, le numéro de téléphone, etc. . .
Une variable qualitative est dite ordinale si ses modalités peuvent être ordonnées. Par
exemple on peut citer : la mention à un examen ("Passable", "Assez-bien", "Bien", "Très-
bien"), la cotation attribuée par un jury (par exemple A = "Très satisfaisant", B = "Satisfai-
sant", . . .), le degré de satisfaction, etc. . .
Remarque 6.8 II arrive (par exemple pour des raisons de traitement informatique) de coder
les modalités d’une variable qualitative avec des valeurs numériques. Dans le cas de la
variable "sexe", par exemple, on pourrait noter 0 pour la catégorie « homme » et 1 pour
la catégorie « femme ». Il est important de souligner que les nombres utilisés pour de tels
Chapitre 6. Concepts fondamentaux de la statistique 71
codages sont non-quantitatifs. Le fait d’attribuer des valeurs numériques pour représenter
les diverses modalités d’une variable qualitative ne signifie pas que ces nombres possèdent
des propriétés arithmétiques. Ces codes ne servent qu’à identifier les modalités de manière
pratique. On n’imagine mal le calcul du sexe moyen dans une population.
O
Préciser la population étudiée, les individus, les caractères et leur nature.
LD
Application 6.10 Indiquer de quel type sont les variables présentées ci-dessous : (qualita-
A
tives nominales, qualitatives ordinales, quantitatives discrètes ou quantitatives continues).
(a) L’état-civil des habitants togolais.
ER
Définition 6.11 Les observations d’un ou plusieurs caractères sur toute la population forment
une série statistique.
Les séries statistiques les plus élémentaires sont les séries à une variable (séries statis-
tiques univariées) et les séries à deux variables (séries statistiques bivariées).
72 MTH160 : Cours et exercices (I. C. GERALDO)
Résumé – Ce chapitre présente les méthodes usuelles de traitement des séries statistiques
à une variable. L’objectif est de savoir représenter graphiquement de telles séries et calculer
les indicateurs numériques qui y sont liés.
Sommaire
O
7.1 Description d’une série statistique à une variable . . . . . . . . . . . . . . 73
7.1.1 Description d’une série quantitative . . . . . . . . . . . . . . . . . . 73
LD
7.1.2 Description d’une série qualitative . . . . . . . . . . . . . . . . . . . 76
7.2 Représentations graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . 76
7.2.1 Variables quantitatives discrètes : diagramme en bâtons et poly-
A
x1 < · · · < x p .
Définition 7.1 Si X est continue, les modalités sont regroupées en intervalles appelés classes
pour rendre les données plus lisibles. L’ensemble C des modalités est partagé en classes
C1 , . . . , C p , la classe Ci étant de la forme Ci = [ ai−1 , ai [ où ai−1 < ai . Les nombres ai−1 et
a i −1 + a i
ai sont appelés les bornes de la classe Ci , ci = son centre et li = ai − ai−1 son
2
73
74 MTH160 : Cours et exercices (I. C. GERALDO)
amplitude. Par convention, a0 (resp. a p ) désigne la plus petite (resp. la plus grande) valeur
prise par X.
Définition 7.2 Soit X une variable discrète (resp. continue) décrite par ses modalités (resp.
ses classes) x1 , · · · , x p (resp. C1 = [ a0 , a1 [, . . ., C p = [ a p−1 , a p [). On appelle :
1) effectif de la valeur xi (resp. de la classe Ci ) : le nombre ni d’individus pour lesquels
X = xi (resp. X ∈ Ci c’est-à-dire ai−1 ⩽ X < ai ) ;
ni
2) fréquence de la valeur xi (resp. de la classe Ci ) : le rapport f i = ;
n
3) effectif cumulé croissant associé à xi (resp. à ai ) :
i
nic = n1 + · · · + ni = ∑ nk ;
k =1
en d’autres termes, nic est le nombre d’individus pour lesquels X prend les modalités
inférieures ou égales à xi (resp. ai ) ;
4) effectif cumulé décroissant associé à xi (resp. à ai−1 ) :
p
nid = ni + · · · + n p = ∑ nk ;
k =i
en d’autres termes, nid est le nombre d’individus pour lesquels X prend les modalités
supérieures ou égales à xi (resp. ai ).
5) On définit les fréquences cumulées croissantes et les fréquences cumulées décrois-
nic n
santes en divisant les effectifs cumulés correspondants par n. Ainsi f ic = et f id = id ,
n n
pour tout i = 1, . . . , p.
6) On appelle distribution statistique de la variable X, la suite de couples ( xi , ni ) (resp.
(Ci , ni )), i = 1, . . . , p.
Remarque 7.3
1) Les effectifs associés aux différentes modalités (ou classes) vérifient la relation
p
n1 + · · · + n p = ∑ ni = n.
i =1
2) Chaque fréquence f i est un nombre décimal compris entre 0 et 1 et peut donc être expri-
mée en pourcentage. De plus, la somme des fréquence est égale à 1 ou 100%.
3) On notera aussi que n pc = n1d = n et f pc = f 1d = 1 ou 100%.
4) Il est souvent plus commode de définir la distribution statistique d’une variable par un
tableau de données de la forme :
Chapitre 7. Séries statistiques à une variable 75
Modalités x1 ... xp
Effectifs n1 ... np
Nombre d’enfants xi 0 1 2 3 4
Nombre de couples ni 12 20 5 2 1
Exemple 7.4 On a relevé le nombre d’enfants de 40 couples. Les résultats obtenus sont don-
nés dans le tableau 7.2.
Nous pouvons compléter ce tableau avec les fréquences et les effectifs cumulés.
xi 0 1 2 3 4
ni 12 20 5 2 1
O
nic 12 32 37 39 40
nid 40 28 8 3 1
LD
f i (%) 30 50 12.5 5 2.5
f ic (%) 30 80 92.5 97.5 100
A
f id (%) 100 70 20 7.5 2.5
ER
Quelle interprétation pouvons-nous donner aux valeurs en gras ? 12.5% des couples
interrogés ont exactement 2 enfants, 92.5% de ces couples ont 2 enfants ou moins, 20% des
couples ont 2 enfants ou plus.
.G
Exemple 7.5 On a noté l’âge (arrondi à l’année près) de 48 salariés d’une entreprise. La série
C
43 29 57 45 50 29 37 59 46 31 46 24
33 38 49 31 62 60 52 38 43 26 41 52
60 49 52 41 38 26 37 59 57 41 29 33
33 43 46 57 46 33 46 49 57 57 46 43
Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[
ni 6 6 5 7 10 4 7 3
Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[
ni 6 6 5 7 10 4 7 3
nic 6 12 17 24 34 38 45 48
nid 48 42 36 31 24 14 10 3
Quelle interprétation pouvons-nous donner aux valeurs en gras ? 24 salariés ont moins
de 45 ans, 31 salariés ont 40 ans ou plus.
Exemple 7.6 Reprenons les données du tableau 6.1 (page 71). L’effectif total de la popula-
tion est n = 6 191 155. Le tableau des fréquences est le suivant :
On peut y lire notamment que la région maritime abrite à elle seule 42% de la population
togolaise (en 2010).
Le polygone des effectifs (resp. des fréquences) est obtenu à partir du diagramme en
bâtons en joignant par un segment les sommets des bâtons.
Exemple 7.7 La figure 7.1 donne le diagramme à bâtons et le polygone des effectifs associés
au tableau 7.2.
Chapitre 7. Séries statistiques à une variable 77
20
20
15
15
Nombre de couples
Nombre de couples
10
10
5
5
0
0
0 1 2 3 4 0 1 2 3 4
F IGURE 7.1 – Diagramme en bâtons et polygone des effectifs associés au tableau 7.2.
O
Soit ([ ai−1 , ai [, ni ), i = 1, . . . , p une série statistique quantitative continue et soient f 1 , . . . , f p
les fréquences respectives associées à chaque classe.
LD
7.2.2.1 Histogramme
A
hi = , i = 1, . . . , p. (7.1)
li
Ainsi, l’aire totale de l’histogramme est égale à 1.
C
sur les valeurs extrêmes ; il permet de déceler, éventuellement, des valeurs aberrantes.
Exemple 7.8 Reprenons le tableau 7.3 et complétons-le avec les hauteurs des rectangles
composant l’histogramme.
Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[
ni 6 6 5 7 10 4 7 3
fi 6/48 6/48 5/48 7/48 10/48 4/48 7/48 3/48
li 10 5 5 5 5 5 5 5
hi ≃ 0.0125 0.025 0.0208 0.0292 0.0417 0.0167 0.0292 0.0125
0.04
0.03
0.02
0.01
0.00
20 30 35 40 45 50 55 60 65
Age
Remarque 7.9 Une particularité de l’histogramme est que l’échelle verticale n’a pas de si-
gnification particulière. On peut vérifier qu’un histogramme représente les fréquences par
la surface des blocs et non par leur hauteur.
Exemple 7.10 Complétons les données du tableau 7.3 par les fréquences cumulées crois-
santes et décroissantes.
Les polygones des fréquences cumulées croissantes et décroissantes sont superposés sur
la figure 7.3.
Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[
ni 6 6 5 7 10 4 7 3
fi 6/48 6/48 5/48 7/48 10/48 4/48 7/48 3/48
f ic 6/48 12/48 17/48 24/48 34/48 38/48 45/48 1
f id 1 42/48 36/48 31/48 24/48 14/48 10/48 3/48
1.0
0.8
Fréquences cumulées
0.6
0.4
O
0.2
LD
0.0
A
20 30 35 40 45 50 55 60 65
Age
ER
F IGURE 7.3 – Polygones des fréquences cumulées croissantes (ligne continue) et décroissantes (en
tirets) de l’âge des salariés.
.G
C
0 si x < x0 ;
i −1 x − a i −1
FX ( x ) =
∑ f j + a i − a i −1 f i si a i −1 ⩽ x < a i , i = 1 . . . , p; (7.2)
j =1
1 si x ⩾ xp.
La valeur FX ( x ) est nulle pour les valeurs de x inférieures à la plus petite valeur a0 et égale
à 1 pour les valeurs de x supérieures à la plus grande valeur a p .
Pour tout x ∈ R, FX ( x ) est une estimation de la proportion des individus pour lesquels
X ⩽ x. Pour ce faire, on fait l’hypothèse fondamentale que les valeurs sont équiréparties
(uniformément réparties) au sein de chaque classe.
80 MTH160 : Cours et exercices (I. C. GERALDO)
Il est aussi possible de faire diagramme à barres horizontales des effectifs ou des fré-
quences. Dans ce cas, c’est plutôt l’axe des ordonnée qui correspond aux différentes moda-
lités de la variable et l’axe des abscisses aux effectifs ou fréquences associées.
Exemple 7.11 La figure 7.4 donne les diagrammes à barres verticales des effectifs et à barres
horizontales des fréquences associés au tableau 6.1.
Savanes
2500000
Kara
Centrale
1500000
Plateaux
500000
Maritime
0
(a) Diagramme à barres verticales (effectifs) (b) Diagramme à barres horizontales (fré-
quences)
F IGURE 7.4 – Diagrammes à barres verticales (effectifs) et à barres horizontales (fréquences) associés
au tableau 6.1.
Savanes
Kara
Centrale
Plateaux
Maritime
O
LD
obtenus par la formule :
ni
A
αi = 360 × = 360 × f i , i = 1, . . . , p. (7.3)
n
ER
Exemple 7.13 Reprenons les données du tableau 6.1 et complétons ce tableau par les angles
αi . On obtient le tableau suivant :
.G
TABLE 7.7 – Angles du diagramme circulaire associé aux données du RGPH 2010.
C
Remarque 7.14 Dans toute la suite de cette section, sauf mention contraire, nous considé-
rons un caractère quantitatif X étudié sur une population de taille n. Les observations seront
notées x1 , . . . , xn et les modalités x1 , . . . , x p .
82 MTH160 : Cours et exercices (I. C. GERALDO)
Maritime
(42%)
Plateaux
(22.2%)
Savanes
(13.4%)
Centrale Kara
(10%) (12.4%)
Encore appelées caractéristiques de tendance centrale, elles donnent une idée de l’ordre
de grandeur des valeurs constituant la série.
2) Si X est une quantitative continue, une classe modale, Mo( X ), est une classe de densité
(rapport fréquence/amplitude) maximale. Un mode est alors le centre de l’une de ces
classes.
Une distribution statistique est dite unimodale si elle a un seul mode et multimodale si
elle en a plusieurs.
Chapitre 7. Séries statistiques à une variable 83
Définition 7.16 Lorsque l’on dispose des observations sur chacun des n individus de la
population sous la forme x1 , . . . , xn , la moyenne arithmétique est définie par :
1 n
n i∑
X= xi . (7.4)
=1
Proposition 7.17 Si X et Y sont deux variables quantitatives et si a et b sont des réels alors on a :
X + Y = X + Y, aX + b = aX + b et aX = aX.
O
LD
Remarque 7.18 La moyenne arithmétique est la mesure de tendance centrale des variables
quantitatives la plus utilisée. Chaque observation a le même poids qui est 1/n. La moyenne
arithmétique est sensible aux valeurs extrêmes.
A
Pour les variables continues, on suppose que les observations d’une classe sont unifor-
mément réparties à l’intérieur de ladite classe. Cela revient à supposer que chaque centre est
.G
p
n1 c1 + · · · + n p c p 1
X≃ = ∑ ni ci . (7.6)
n n i =1
I.
Remarque 7.19 Généralement quand l’on parle de moyenne, on pense tout de suite à la
moyenne arithmétique. Mais il existe d’autres types de moyennes (moyenne géométrique,
moyenne harmonique, moyenne quadratique) qui peuvent être plus adaptés dans certains
contextes particuliers. Ces autres types de moyennes ne sont pas abordés dans ce cours.
7.3.1.4 Médiane
Définition 7.20 La médiane est la valeur notée me qui partage la série des observations
classées par ordre croissant en deux parties comprenant exactement le même nombre d’ob-
servations de part et d’autre de me .
Dans la pratique, le calcul de la médiane utilise le tableau des effectifs (ou fréquences)
cumulés croissants. La médiane correspond à un effectif cumulé croissant de n/2 ou une
84 MTH160 : Cours et exercices (I. C. GERALDO)
m e = x ( k + 1 ) = x ( n +1 ) .
2
• Si n est pair, alors on peut écrire n = 2k où k est un entier naturel non nul. On peut
décomposer la série comme suit :
La médiane peut être prise égale à toute valeur comprise entre x(k) et x(k+1) . Il est
d’usage de choisir la moyenne de ces deux valeurs comme médiane :
x ( k ) + x ( k +1)
me = .
2
Exemple 7.21
1) Considérons les dix observations suivantes : 1, 1, 1, 2, 2, 2, 2, 3, 3, 4. Le nombre 10 est
pair et sa moitié vaut 5. La médiane est la moyenne de la 5e et de la 6e observations soit
me = 2+2 2 = 2.
2) Considérons les sept observations suivantes : 0, 0, 1, 1, 2, 3, 4. Le nombre 7 est impair et
7+1
2 = 4. La médiane est la 4 observation soit me = 1.
e
• S’il existe une classe Ci = [ ai−1 , ai [ telle que nic = n/2 ou f ic = 50%, alors me = ai ;
• Sinon il existe deux classes adjacentes Ci = [ ai−1 , ai [ et Ci+1 = [ ai , ai+1 [ telles que
nic < n/2 < n(i+1)c ou f ic < 50% < f (i+1)c . Ainsi ai < me < ai+1 et on calcule une
valeur approximative de me par interpolation linéaire. Pour faire ce calcul, on suppose
que la distribution est uniforme à l’intérieur de chaque classe.
L’interpolation linéaire consiste à dire que les trois points A( ai , nic ), B( ai+1 , n(i+1)c ) et
M (me , n/2) sont approximativement alignés.
n ( i +1) c B
•
n M
2 •
A
nic •
ai me a i +1
O
LD
F IGURE 7.7 – Illustration de l’interpolation linéaire pour l’approximation de la médiane
n
2− nic m e − ai
ER
=
n(i+1)c − nic a i +1 − a i
d’où
.G
n
2− nic
m e = a i + ( a i +1 − a i ) . (7.7)
n(i+1)c − nic
C
2
m e = a i + ( a i +1 − a i ) . (7.8)
f (i+1)c − f ic
Remarque 7.22 Pour les distributions continues, la médiane est l’abscisse du point d’inter-
section des polygones des fréquences cumulées croissantes et décroissantes.
Définition 7.23 Considérons une série statistique classée par ordre croissant. Les quartiles
sont trois valeurs notées Q1 , Q2 et Q3 qui partagent la distribution en quatre parties com-
prenant exactement le même nombre d’observations. Plus précisément, le premier quartile
(resp. le second quartile, resp. le troisième quartile) noté Q1 (resp. Q2 , resp. Q3 ) est la va-
leur correspondant à une fréquence cumulée croissante 25% (resp. 50%, resp. 75%) ou à
l’effectif cumulé croissant n4 (resp. n2 , resp. 3n
4 ).
86 MTH160 : Cours et exercices (I. C. GERALDO)
Le calcul du quartile Q1 (resp. Q3 ) se fait en utilisant la même méthode que celle décrite
pour la médiane en prenant soin de remplacer la fréquence cumulée croissante 50% par 25%
(resp. 75%) et l’effectif cumulé croissant n/2 par n/4 (resp. 3n/4).
Définition 7.26 Soit X une variable quantitative étudiée sur une population et soit α ∈
[0, 1]. On appelle quantile (ou fractile) d’ordre α, la valeur xα de la variable X telle que la
proportion d’observations inférieures ou égales à xα soit égale à α.
Les quantiles les plus usuels sont la médiane et les quartiles. La médiane est le quantile
d’ordre 50%, les quartiles Q1 et Q3 sont les quantiles d’ordres respectifs 25% et 75%.
Chapitre 7. Séries statistiques à une variable 87
Définition 7.27 Lorsque l’on dispose des observations x1 , . . . , xn , la variance (ou écart qua-
dratique moyen) est définie par :
1 n
n i∑
Var( X ) = ( x i − X )2 . (7.9)
=1
O
p
1
n i∑
Var( X ) = n i ( x i − X )2 . (7.10)
=1
LD
La racine carrée de la variance notée σX est appelée écart-type de X :
q
A
σX = Var( X ). (7.11)
ER
=1
n i =1
ou encore
I.
!
p p
1 1 2
n i∑ n i∑
n i ( x i − X )2 = ni xi2 − X = X 2 − ( X )2 . (7.13)
=1 =1
où X 2 désigne la moyenne des carrés. En d’autres termes, la variance est égale à la moyenne (arith-
métique) des carrées moins le carré de la moyenne.
Lorsqu’on ne dispose que des classes, il n’est pas possible de trouver une valeur exacte
de la variance. En supposant que les données sont uniformément distribuées à l’intérieur
de chaque classe, on obtient une approximation de la variance par la formule
p
1
n i∑
Var( X ) ≃ n i ( c i − X )2
=1
Remarque 7.29 La variance et l’écart-type sont les caractéristiques de dispersion les plus
utilisée. L’écart-type présente l’avantage de s’exprimer dans la même unité que la variable
étudiée.
Var( aX + b) = a2 Var( X ).
lorsque la série statistique est donnée sous la forme ( x1 , n1 ), . . . , ( x p , n p ) avec les mo-
dalités et les effectifs. L’écart moyen donne l’ordre de grandeur des déviations autour
de la moyenne.
• Coefficient de variation : Il est défini pour les variables positives comme le rapport
de l’écart-type avec la moyenne arithmétique :
σX
CV = .
X
Le coefficient de variation est un nombre sans unité et est invariable par changement
d’échelle sur les données. Il permet donc de comparer les dispersions du caractère
sur des populations ayant des valeurs moyennes très différentes ou de comparer des
variables quantitatives différentes même si les données ne sont pas exprimées dans
les mêmes unités. Un CV petit indique une distribution du caractère moins dispersée.
Chapitre 7. Séries statistiques à une variable 89
xi 0 1 2 3 4
ni 12 20 5 2 1
• Moyenne :
1
X= (12 × 0 + 20 × 1 + 5 × 2 + 2 × 3 + 1 × 4) = 1.
40
• Ecart-type :
1
Var( X ) = (12 × 0 + 20 × 1 + 5 × 4 + 2 × 9 + 1 × 16) − 1 = 0.85
40
√
d’où σX = 0.85 ≃ 0.9219544.
O
• Médiane : rangeons les données dans l’ordre croissant. Comme le nombre d’obser-
vations est pair (n = 40),
x(20) + x(21)
LD
me = = 1.
2
• Quartiles Q1 et Q3 : n = 40 est multiple de 4 et k = n4 = 10. Ainsi,
A
Q1 = =0 et Q3 = = 1.
2 2
Exemple 7.32 Reprenons les données du tableau 7.3. Complétons le tableau avec quelques
.G
Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[
ci 25 32.5 37.5 42.5 47.5 52.5 57.5 62.5
I.
ni 6 6 5 7 10 4 7 3
nic 6 12 17 24 34 38 45 48
• Etendue : e( X ) = 65 − 20 = 45.
• Moyenne :
1 8
48 i∑
X≃ ni ci ≃ 43.85417.
=1
36 − 34
Q3 = 50 + (55 − 50) × = 52.5.
38 − 34
Chapitre 7. Séries statistiques à une variable 91
7.4 E XERCICES
Exercice 7.1 La répartition des élèves d’un lycée en fonction de la langue vivante étudiée
est donnée par le tableau suivant :
Langue Anglais Allemand Espagnol Italien Autres Total
Effectifs 934 351 205 69 41 1600
1) Préciser la population étudiée, l’unité statistique, le caractère, sa nature et ses modalités.
2) Compléter le tableau avec les fréquences.
3) Représenter cette distribution par un diagramme à secteurs.
4) Préciser le mode du caractère étudié.
5) Quel est le pourcentage d’élèves qui n’étudient pas l’anglais ?
Exercice 7.2 Un institut de statistique a réalisé une enquête sur le nombre de salariés de 40
entreprises de Lomé-la-belle. Les résultats suivants rangés dans l’ordre croissant sont les
suivants :
O
20 22 24 30 32 36 37 39 40 41
43 44 45 45 47 48 50 51 51 52
LD
52 53 53 55 56 58 59 59 61 62
63 64 66 75 76 79 82 86 90 99
A
cinq (5) classes de la forme [ ai , ai+1 [ d’amplitudes respectives 20, 10, 10, 20, 20. La valeur
minimale est 20 et la valeur maximale est 100. On complètera le tableau obtenu en y
.G
Exercice 7.3 Le tableau suivant donne la répartition du personnel d’une société suivant le
salaire mensuel en kFCFA (milliers de FCFA) :
Salaire [150,160[ [160,170[ [170,180[ [180,190[ [190,200[ [200,250[ [250,300[
Effectif 5 13 15 18 14 4 5
1) Calculer la moyenne, la variance, l’écart-type, la médiane et les quartiles Q1 et Q3 .
2) Déterminer le pourcentage de personnel dont le salaire est inférieur à 200 kFCFA.
Masse (mg) [145, 155[ [155, 165[ [165, 175[ [175, 185[ [185, 195[
Effectifs 7 30 43 16 4
Faire une étude graphique et un résumé statistique de la masse de paracétamol des suppo-
sitoires fabriqués dans ce laboratoire.
Exercice 7.5 On observe l’arrivée des clients à un bureau de poste pendant un intervalle de
temps donné. En répétant 100 fois l’observation, on obtient les résultats suivants :
Nombre d’arrivées 1 2 3 4 5 6
Effectif 15 25 26 20 7 7
Résumé – Ce chapitre présente les méthodes usuelles de traitement des séries statistiques à
deux variables. L’objectif est de savoir faire une étude statistique descriptive sur les données
observées sur une population dans un cadre bivarié et plus spécifiquement, de savoir faire
des prévisions à l’aide d’un ajustement linéaire ou non linéaire.
Sommaire
O
8.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
LD
8.2 Caractéristiques numériques . . . . . . . . . . . . . . . . . . . . . . . . . . 95
8.2.1 Cas des données non groupées . . . . . . . . . . . . . . . . . . . . . 95
8.2.2 Cas des tableaux de contingence (données groupées) . . . . . . . . 96
A
néaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
8.5.1 Ajustement par une fonction puissance . . . . . . . . . . . . . . . . 103
I.
8.1 G ÉNÉRALITÉS
Dans une enquête statistique, il est rare de ne s’intéresser qu’à une seule variable sta-
tistique. Une « intuition » des spécialistes d’un domaine peut conduire à observer deux ou
plusieurs variables chez une même population et à rechercher l’existence d’un lien de dé-
pendance entre ces variables. Dans ce chapitre, nous nous focalisons sur le cas de deux
variables.
Définition 8.1 Soient Ω une population de taille n, X et Y deux variables statistiques obser-
vées sur Ω. On appelle série statistique à deux variables X et Y (ou à deux dimensions ou
93
94 MTH160 : Cours et exercices (I. C. GERALDO)
et
p q p q
n= ∑ ∑ nij = ∑ ni • = ∑ n• j .
i =1 j =1 i =1 j =1
La dernière colonne (en rouge) et la dernière ligne (en bleu) du tableau (appelées
marges) contiennent respectivement les effectifs totaux par ligne et par colonne. Elles
donnent respectivement la distribution marginale de X définie par le tableau
X x1 x2 ··· xp Total
Effectif ni• n 1• n 2• ··· n p• n
Chapitre 8. Séries statistiques à deux variables 95
Exemple 8.3 Dans une université, on a enquêté auprès de 5375 étudiants n’ayant aucun lien
de parenté entre eux, sur leurs habitudes tabagiques (variable Y) et celles de leurs parents
(variable X). Les données obtenues sont consignées dans le tableau suivant :
Statut de l’étudiant
Nombre de Fumeur Non Total
parents fumeurs fumeur
O
Deux 400 1380 1780
Un seul 416 1823 2239
LD
Aucun 188 1168 1356
Total 1004 4371 5375
A
et
Statut de l’étudiant Fumeur Non fumeur Total
C
1 n 1 n
n i∑ n i∑
Cov( X, Y ) = ( x i − X )( y i − Y ) = xi yi − XY.
=1 =1
Cov( X, Y ) Cov( X, Y )
ρ XY = p p = ∈ [−1, 1].
Var( X ) Var(Y ) σX σY
Exemple 8.2 (suite) On vérifie que X = 400, Y = 60, n1 ∑in=1 xi yi = 26357.143 donc Cov( X, Y ) =
2357.143. De plus, Var( X ) = 40000, Var(Y ) = 164.2857 donc σX = 200 et σY = 12.8174.
Finalement, ρ XY ≃ 0.92.
p p
1 1
Var( X ) = ∑
n i =1
ni• ( xi − X )2 = ∑ ni• xi2 − ( X )2 ,
n i =1
q q
1 1
Var(Y ) = ∑
n j =1
n• j (y j − Y )2 = ∑ n• j y2j − (Y )2 ,
n j =1
q q
σX = Var( X ) et σY = Var(Y ).
La covariance est calculée à l’aide de la formule
p q p q
1 1
Cov( X, Y ) = ∑ ∑ nij ( xi − X )(y j − Y ) = ∑ ∑ nij xi y j − XY.
n i =1 j =1 n i =1 j =1
Remarque 8.4 Lorsque les modalités des variables X et/ou Y sont des intervalles (ou classes),
les xi et/ou y j sont remplacés par les centres des classes.
L’analyse descriptive d’un tableau de contingence est facilitée par le calcul de deux ta-
bleaux des fréquences conditionnelles appelés profils-lignes et profils-colonnes.
Remarque 8.6 Dans le tableau des profils-lignes, la somme de chaque ligne vaut 1 et la
somme des colonnes n’a pas de sens et doit donc être évitée. De même, dans le tableau des
profils-colonnes, la somme de chaque colonne vaut 1 et la somme des lignes n’a pas de sens
et doit aussi être évitée.
O
parents fumeurs fumeur
Deux 0.2247 0.7753 1
LD
Un seul 0.1858 0.8142 1
Aucun 0.1386 0.8614 1
A
On peut interpréter la première ligne comme suit : parmi les étudiants dont les deux
parents sont fumeurs, il y en a 22.47% qui sont fumeurs et 77.53% qui sont non-
ER
fumeurs.
• Le tableau des profils-colonnes arrondis à quatre chiffres après la virgule est donné
.G
par :
Statut de l’étudiant
C
Exemple 8.2 (suite) Le nuage de points associé aux données de l’exemple 8.2 est donné par
la figure 8.1 (page 98).
80
70
Rendement (q/ha)
60
50
40
Exemple 8.3 (suite) Les diagrammes à barres juxtaposées associés aux profils-lignes et
profils-colonnes de l’exemple 8.3 sont donnés par la figure 8.2 (page 98).
60
Proportion de parents fumeurs (en %)
Proportion d'enfants fumeurs (en %)
50
80
40
60
30
40
20
20
10
0
L’ajustement linéaire est très utilisé dans la pratique non seulement à cause de sa simpli-
cité mais aussi certains ajustements non linéaires (que nous verrons dans la suite) peuvent
être ramenés à un ajustement linéaire au moyen d’une transformation mathématique et/ou
O
d’un changement de variable. LD
8.4.2 Méthode des moindres carrés ordinaires (MCO)
A
y
(∆) : y = ax + b
ER
εn •
•
.G
axi + b •
εi
yi •
C
ε1 •
•
I.
x1 xi xn x
On cherche la droite (∆) d’équation y = ax + b (a, b ∈ R) qui passe le plus près possible
de tous les points du nuage.
• L’ajustement de la droite de régression au nuage de points est donné par la figure 8.4
(page 100).
80
70
Rendement (q/ha)
60
50
40
F IGURE 8.4 – Ajustement de la droite de régression sur le nuage de points des données du rende-
ment
( DX/Y ) : x = a′ y + b′ , (8.4)
où
Cov( X, Y )
a′ = et b′ = X − a′ Y.
Var(Y )
Remarque 8.11 Pour que la droite de régression ( DX/Y ) puisse être déduite de ( DY/X ), il
faudrait aussi que l’on ait
y b
x = − = a′ y + b′
a a
1
c’est-à-dire a′ = a (puisque cette relation entraîne b′ = −b/a). On aurait donc
Cov( X, Y ) Var( X )
=
Var(Y ) Cov( X, Y )
O
soit
(Cov( X, Y ))2
LD
=1
Var( X )Var(Y )
soit encore ρ2XY = 1.
A
ER
reusement à cette question, nous avons besoin de certaines notions et techniques de statis-
tique inférentielle qui dépassent largement le cadre de ce cours. Toutefois, nous donnons
quelques indicateurs pouvant permettre de répondre à cette question.
C
1 n
n i∑
VT = (yi − Y )2 = Var(Y );
=1
1 n
n i∑
VE = (ŷi − Y )2 ;
=1
1 n 2 1 n
n i∑ ∑ (yi − ŷi )2 .
VR = ε i =
=1
n i =1
102 MTH160 : Cours et exercices (I. C. GERALDO)
Théorème 8.13 Les trois variances définies plus haut vérifient la relation suivante
VT = VE + VR (8.5)
0 ⩽ R2 ⩽ 1.
Plus R2 est grand (proche de 1), plus la variance expliquée est grande et plus la variance
résiduelle est faible. En d’autres termes, plus R2 est proche de 1, plus on peut dire que
la droite de régression s’ajuste « bien » aux données observées. Le coefficient R2 mesure
donc la proportion de la variabilité (ou la proportion de l’information) contenue dans les
données que la droite de régression a su expliquer. Il mesure donc aussi l’intensité de la
liaison linéaire entre ( x1 , . . . , xn ) et (y1 , . . . , yn ).
Exemple 8.2 (suite et fin) On trouve R2 ≈ 0.85 donc on peut dire l’ajustement linéaire
explique environ 85% de l’information contenue dans les données.
y = bx a
O
Il s’agit des ajustements de la forme LD
y = be ax
rithme, on obtient
ln y = ax + ln b.
ER
1
y=
1 + e−(ax+b)
où y est une variable positive et a ∈ R et b ∈ R+ sont à déterminer. On a :
1 1
y= ⇐⇒ = 1 + e−(ax+b)
1 + e−(ax+b) y
1
⇐⇒ − 1 = e−(ax+b)
y
1−y
⇐⇒ = e−(ax+b)
y
1−y
⇐⇒ ln = −( ax + b)
y
y
⇐⇒ ln = ax + b.
1−y
104 MTH160 : Cours et exercices (I. C. GERALDO)
En posant
y
z = ln ,
1−y
on obtient un ajustement linéaire de la forme z = ax + b où a et k sont calculés par la
méthode MCO.
Chapitre 8. Séries statistiques à deux variables 105
8.6 E XERCICES
N.B. L’on pourra consulter l’annexe B pour une illustration graphique des différents ajus-
tements.
Exercice 8.1 L’observation des prix et des quantités sur un marché de la tomate a donné les
résultats suivants :
Quantités x en kg 10 20 35 50 70 90 110 130
Prix y au kg en kFCFA 5 3.75 2.75 2.25 1.75 1.25 0.8 0.5
où 1 kFCFA = 1000 FCFA. Ainsi, une quantité de 35 kg de tomates est vendue au prix de
2750 FCFA le kg.
1) Représenter le nuage de points.
2) (a) Déterminer la droite d’ajustement linéaire y = ax + b par la méthode MCO.
(b) Prévoir le prix d’un kg de tomates pour un achat de 140 kg et en déduire que l’ajus-
tement linéaire n’est pas réaliste.
O
3) (a) Chercher maintenant un ajustement non linéaire de la forme y = a ln x + b. On
LD
pourra poser z = ln x et se ramener à un ajustement linéaire y = az + b.
(b) Calculer le coefficient R2 de l’ajustement linéaire entre z et y.
(c) Prévoir le prix au kg pour un achat de 140 kg.
A
ER
Exercice 8.2 On a relevé la distance de freinage y d’un véhicule (distance parcourue par
le véhicule entre le moment où le conducteur commence à freiner et l’arrêt du véhicule) à
décélération constante sur une route plane sèche pour différentes vitesses x en km/h. Les
.G
Les experts affirment que la distance d’arrêt d’un véhicule est proportionnelle à son énergie
cinétique et donc au carré de sa vitesse. On cherche à confirmer cela à l’aide d’un ajustement
par une fonction puissance de la forme y = kx α , où k et α sont des constantes à déterminer.
1) Montrer en faisant un changement de variable simple, qu’on peut se ramener à un pro-
blème de régression linéaire simple puis déterminer les coefficients k et α par la méthode
des moindres carrés.
2) Les résultats obtenus confirment-ils l’affirmation des experts ?
3) Confirmer la qualité du modèle en calculant le coefficient de corrélation linéaire entre y
et x2 .
4) Estimer la distance de freinage correspondant à une vitesse de 70 km/h.
Exercice 8.3 Dans une expérience de cinétique chimique, l’on a mesuré la concentration x
d’une substance chimique en fonction du temps t et obtenu les valeurs numériques sui-
vantes :
106 MTH160 : Cours et exercices (I. C. GERALDO)
t 20 30 40 50 60 70 80
x 0.05 0.10 0.27 0.52 0.80 0.90 0.95
Exercice 8.4 La concentration molaire C d’une espèce chimique est mesurée au cours du
temps. On obtient les données suivantes :
Annexe
O
LD
A
ER
.G
C
I.
107
A NNEXE A
O
LD
A
ER
.G
C
I.
109
110 MTH160 : Cours et exercices (I. C. GERALDO)
0.00 0.5000 0.5040 0.5080 0.5120 0.5150 0.5199 0.5239 0.5279 0.5319 0.5359
0.10 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5754
0.20 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.30 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.40 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.50 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.60 0.7258 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7518 0.7549
0.70 0.7580 0.7612 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.80 0.7881 0.7910 0.7939 0.7967 0.7996 0.8023 0.8051 0.8079 0.8106 0.8133
0.90 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.00 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.10 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.20 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.30 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.40 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.50 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9430 0.9441
1.60 0.9452 0.9463 0.9474 0.9485 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.70 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.80 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9700 0.9706
1.90 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9762 0.9767
2.00 0.9773 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.10 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.20 0.9861 0.9865 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.30 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.40 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.50 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.60 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.70 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.80 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9980 0.9980 0.9981
2.90 0.9981 0.9982 0.9983 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
Grandes valeurs de x
x 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8
Φ( x ) 0.99865 0.99903 0.99931 0.99952 0.99966 0.99977 0.99984 0.99989 0.99993
Exercice 8.1
5
y=ax+b
y=a*ln(x)+b
4
O
Prix au kg (y)
LD
2
A
1
ER
20 40 60 80 100 120
.G
Quantité en kg (x)
C
Exercice 8.2
I.
80
Distance de freinage (m)
60
40
20
40 60 80 100 120
Vitesse (km/h)
111
112 MTH160 : Cours et exercices (I. C. GERALDO)
Exercice 8.3
0.8
Concentration
0.6
0.4
0.2
20 30 40 50 60 70 80
Temps
Exercice 8.4
C=1/(at+b)
0.25
C=at+b
Concentration (C)
0.20
0.15
0.10
20 40 60 80 100 120
Temps (t)
R ÉFÉRENCES BIBLIOGRAPHIQUES
[1] S. B ELHAJ & A. B EN A ÏSSA – Mathématiques pour l’informatique, Vuibert, Paris, 2013.
O
[5] D. F REDON , M. M AUMY-B ERTRAND & F. B ERTRAND – Mathématiques : Statistique et
LD
probabilités en 30 fiches, Dunod, 2009.
[8] J.-P. L ECOUTRE – Statistique et probabilités : Travaux dirigés, 4ème éd., Dunod, 2008.
[9] — , Statistique et probabilités (cours et exercices corrigés), 6ème éd., Dunod, 2016.
C
Paris, 2006.
[12] R. V EYSSEYRE – Statistique et probabilités pour l’ingénieur, 2e éd., Dunod, Paris, 2006.
113