Proba Stat SDM
Proba Stat SDM
Proba Stat SDM
Dr Mory Ouattara
USP
SDM
17 octobre 2022
Tribus
Tribus borélienne
Définition
Lorsque X est un espace topologique (c’est à dire muni d’une famille
d’ouverts), la plus petite tribu contenant tous les ouverts est appelée
la tribu borélienne. Elle est notée B(X ).
Définition
Une application f : (X ; A) −→ (Y ; B) est dite mesurable si ∀B ∈ B,
f −1 (B) ∈ A.
Mesures
On considère (X ; A) un espace mesurable.
Définition
Une mesure µ sur (X ; A) est une application de A −→ [0; +1] telle
que :
µ(∅) = 0
si (An )n≥1 est une suite dénombrable d’ensembles de A deux à
deux disjoints alors
+∞
X
µ (∪∞
n=1 An ) = µ(An )
n=1
Exemples de Mesures
Espaces de probabilité
Définition
Une probabilité sur Ω est une application P : P(Ω) −→ [0, 1], définie
sur les événements, telle que :
P(Ω) = 1
pour toute suite (An )n∈N d’événements disjoints deux à deux,
X
P(∪n∈N An ) = P(An )
n∈N
Espaces de probabilités
Propriétés
1 P(∅) = 0
2 Pour tout événement A, P(Ac ) = 1 − P(A)
3 Si A ⊂ B, alors P(A) ≤ P(B)
4 Pour tous événements A et B,
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
Espaces de probabilités
Rappels de dénombrement
Soit E un ensemble fini.
Une permutation de E est une façon d’ordonner les éléments de E .
n! = 1 × 2 × 3 × . . . × (n − 2) × (n − 1) × n.
Un arrangement de k éléments de E est une suite de k éléments de E
distincts 2 à 2. L’ordre est important.
n!
Akn = n(n − 1) . . . (n − k + 1) =
(n − k)!
.
Une combinaison de k éléments de E est une façon de choisir k
éléments de E , sans spécifier d’ordre : c’est un sous-ensemble de E à
k éléments.
n(n − 1) . . . (n − k + 1) n!
Cnk = =
k! k!(n − k)!
Dr Mory Ouattara (USP SDM) Probabilités et Statistiques 17 octobre 2022 15 / 1
Espaces de probabilité Espaces de probabilité
Longueur (I )
P(I ) =
T
Probabilités conditionnelles
Définition
Soit B un événement tel que P(B) > 0. Pour A ⊂ Ω, on définit
P(A ∩ B)
P(A | B) =
P(B)
Définition
Deux événements A et B sont indépendants si
P(A ∩ B) = P(A)P(B).
P(F ) = P(F ∩A5 )+(F ∩A6 )+P(F ∩A7 ) = P(F | A5 )P(A5 )+P(F | A6 )P(
Probabilités conditionnelles
On suppose que (An )n est une partition de Ω (= un “découpage” de
Ω) : pourtousi 6= j, Ai ∩ Aj = ∅, et Ω = ∪n An .
Théorème (Théorème des probabilités totales)
X X
P(A) = P(A ∩ An ) = P(A | An )P(An )
n n
.
P(A ∩ B) = P(A)P(B)
.
Définition
Une famille (Ai )i d’événements est indépendante si pour toute
sous-famille finie Ai1 , . . . , Aik on a
Indépendance et complémentaire
Proposition
Si deux événements A et B sont indépendants, alors Ac et B c le sont
aussi, de même que A et B c .
Définition
Une variable aléatoire est une application X : Ω −→ R.
Loi
Définition
Une variable aléatoire est une application X : Ω −→ R.
La loi de X est la probabilité PX sur R définie par : pour tout B ⊂ R,
Définition
Si A est un événement, on introduit la variable aléatoire fonction
indicatrice de A, notée 1A , qui indique si l’événement A est réalisé :
pour tout ω ∈ Ω
1 si ω ∈ A
1A (ω) =
0 sinon
Dr Mory Ouattara (USP SDM) Probabilités et Statistiques 17 octobre 2022 27 / 1
Variables aléatoires
Lois Discrètes
Définition
Une variable aléatoire X est dite discrète si l’ensemble X (Ω) des
valeurs qu’elle prend est dénombrable.
X ∈ B = ∪n {X = bn }
Uniforme
Si E ⊂ R est fini, une variable aléatoire X suit la loi uniforme sur E
1
si pour tout x ∈ E , P(X = x) = cardE
Binomiale
Soit n ∈ N et p ∈ [0, 1]. Une variable aléatoire X suit la loi binomiale
de paramètres n et p (notée B(n, p)) si X est à valeurs dans
{0, 1, . . . , n} et pour k = 0, . . . , n
Lois continues
Définition
Une variable aléatoire X est dite continue ou à densité s’il existe une
fonction fX : R −→ R telle que, pour tout B ⊂ R
Z
PX (B) = P(X ∈ B) = fX (x)dx
B
.
La fonction fX est appelée la densité de X . Une fonction f est la
densité d’une variable aléatoire si, et seulement si
pour tout x ∈ R, f (x) ≥ 0
R
f (x)dx = 1
R X
Si X a pour densité fX , Rpour tous a ≤ b,
b
P(a ≤ X ≤ b) = a fX (x)dx
Dr Mory Ouattara (USP SDM) Probabilités et Statistiques 17 octobre 2022 37 / 1
Variables aléatoires Lois continues
Densités classiques
Uniforme
Soit a < b. La loi uniforme
1sur [a; b] est la loi de densité
1
f (x) = b−a 1[a;b] (x) = b−a si a ≤ x ≤ b
0 sinon
Une variable aléatoire X de loi U([a; b]) est donc à valeurs dans [a; b].
Exponentielle
Soit λ > 0. La loi exponentielle de paramètre λ est la loi de densité
Densités classiques
Exponentielle
Soit λ > 0. La loi exponentielle de paramètre λ est la loi de densité
La loi exponentielle est une loi « sans mémoire ». En effet, pour tous
s, t ≥ 0,
e −λ(s+t)
P(X ≥ s + t | X > s) = = P({X ≥ t})
e −λ(s)
Utilisée pour modéliser les durées de vie de machine sans vieillissement.
Dr Mory Ouattara (USP SDM) Probabilités et Statistiques 17 octobre 2022 39 / 1
Variables aléatoires Lois continues
Fonction de répartition
Définition
Soit X une variable aléatoire. La fonction de répartition de X est la
fonction F (X ) : R −→ R définie par : ∀a ∈ R ;
FX (a) = P(X ≤ a)
Proposition
La fonction de répartition FX est une fonction croissante,
lima−→−∞ FX (a) = 0 et lima−→+∞ FX (a) = 1
Si X et Y sont deux variables aléatoires telles que
FX (t) = FY (t) pour tout t ∈ R, alors X et Y ont même loi.
Proposition
Si X est une variable aléatoire discrète, FX est une fonction
constante par morceaux, dont les sauts se situent aux points de
X (Ω), et le saut en x ∈ X (Ω) a pour hauteur P(X = x).
Fonction de répartition d’une v.a. de loi B(p)
Proposition
Si X est une variable aléatoire discrète, FX est une fonction
constante par morceaux, dont les sauts se situent aux points de
X (Ω), et le saut en x ∈ X (Ω) a pour hauteur P(X = x).
Fonction de répartition d’une v.a. de loi B(p)
Proposition
Si X est une variable aléatoire discrète, FX est une fonction
constante par morceaux, dont les sauts se situent aux points de
X (Ω), et le saut en x ∈ X (Ω) a pour hauteur P(X = x).
Fonction de répartition d’une v.a. de loi unif. sur {1, 2, 3, 4}
Proposition
Si X est une variable aléatoire discrète, FX est une fonction
constante par morceaux, dont les sauts se situent aux points de
X (Ω), et le saut en x ∈ X (Ω) a pour hauteur P(X = x).
Fonction de répartition d’une v.a. de loi unif. sur {1, 2, 3, 4}
Proposition
R x variable aléatoire de densité fX , 0on a pour tout x ∈ R ;
Si X est une
FX (x) = −∞ fX (t)dt et on a la dérivée (FX ) (x) = fX (x) (pour tout
x où fX est continue).
Fonction de répartition d’une v.a. de loi E(λ)
Proposition
R x variable aléatoire de densité fX , 0on a pour tout x ∈ R ;
Si X est une
FX (x) = −∞ fX (t)dt et on a la dérivée (FX ) (x) = fX (x) (pour tout
x où fX est continue).
Fonction de répartition d’une v.a. de loi E(λ)
Proposition
R x variable aléatoire de densité fX , 0on a pour tout x ∈ R ;
Si X est une
FX (x) = −∞ fX (t)dt et on a la dérivée (FX ) (x) = fX (x) (pour tout
x où fX est continue).
Fonction de répartition d’une v.a. de loi Uniforme
Proposition
R x variable aléatoire de densité fX , 0on a pour tout x ∈ R ;
Si X est une
FX (x) = −∞ fX (t)dt et on a la dérivée (FX ) (x) = fX (x) (pour tout
x où fX est continue).
Fonction de répartition d’une v.a. de loi Uniforme
Proposition
R x variable aléatoire de densité fX , 0on a pour tout x ∈ R ;
Si X est une
FX (x) = −∞ fX (t)dt et on a la dérivée (FX ) (x) = fX (x) (pour tout
x où fX est continue).
Inversement, si X est une v.a. telle que FX est
continue sur R
dérivable sauf peut-être en un nombre fini de points, alors X a
pour densité fX = FX0 .
Soit X une variable aléatoire de loi uniforme sur {−1, 0, 1}. On pose
Y =| X |. Alors Y est à valeurs dans {0, 1}, et
1
Y =
1+X
.
On a
Y = φ(X )
1
où : φ(x) −→ 1+x Comme X ∼ ε(λ), on a X > 0 p.s.
φ est strictement décroissante sur ]0; +1[, φ(0) = 1 et limx−→+∞ φ(x) = 0
donc φ(]0; +1[) =]0; 1[.
Espérance
Espérance
Définition
L’espérance d’une variable aléatoire X , notée E [X ], est la moyenne
de ses valeurs, pondérées par leurs probabilités. Si X est discrète,
X
E [X ] = xP(X = x)
x∈X (Ω)
.
Si X est continue, de densité fX ,
Z
E [X ] = xfX (x)dx
R
.
Attention. L’espérance n’est pas toujours définie. Il faut pour cela
que la série ou l’intégrale ci-dessus converge absolument.
Dr Mory Ouattara (USP SDM) Probabilités et Statistiques 17 octobre 2022 59 / 1
Variables aléatoires Fonction de répartition
Espérance
Intérêt, interprétation :
E [X ] donne une indication de l’ordre de grandeur typique de X .
E [X ] est souvent plus simple à calculer (et à interpréter) que la
loi de X .
E [X ] correspond au “prix équitable” à faire payer pour jouer à un
jeu de hasard où le gain est X (dans l’idée que l’on joue un
grand nombre de fois). prix d’assurances, d’actifs financiers
Espérance – Propriétés
Propriétés
1 Si X est constante, égale à c ∈ R (pour tout ω ∈ X (Ω) = c),
alors E [X ] = E [c] = c.
2 Pour tout événement A ⊂ Ω E [1A ] = P(A).
3 L’espérance est linéaire : pour toutes variables aléatoires X et Y ,
et tout réel a ,
E [aX ] = aE [X ] et E [X + Y ] = E [X ] + E [Y ]
Espérance – Propriétés
P(A1 ) = . . . = P(An ) = p
on a vu que
Sn = 1A1 + . . . + 1An
suit la loi binomiale B(n; p) : pour k = 0, . . . , n,
Par linéarité,
Espérance de φ(X )
Espérance de φ(X )
Variance
Variance
Définition
Soit X une variable aléatoire. La variance de X est l’espérance des
carrés des écarts de X à sa moyenne :
Var (X ) = E (X − E [X ])2 ≥ 0
p
L’écart type de X est σ(X ) = Var (X )
NB. À la différence de la variance, l’écart type σ(X ) est homogène à
X : si par exemple X est une distance, alors σ(X ) est une distance
aussi. Ceci justifie l’intérêt de l’écart type.
Variance
Définition
Pour toutes variables aléatoires X et Y et toute constante a,
Var (X ) = E [X 2 ] − E [X ]2
Var (aX ) = a2 Var (X )
Var (X + a) = Var (X )
Var (X + Y ) = Var (X ) + 2Cov (X , Y ) + Var (Y ), où la
covariance est définie par :
X − E (X )
Z=
σ(X )
est centrée (E (Z ) = 0) et réduites (var (Z ) = 1)
Moments
µr (X ) = E ((X − E [X ])r
Variance exemples
Variance exemples
Si X suit la loi géométrique G (p)
1−p
Var (X ) =
p2
Indication : dériver deux fois
∞
X 1
xk =
k=0
1−x
pour obtenir
∞
X 2 3 k
k(k − 1)x =
k=2
1−x
et en déduire le calcul de E [X (X − 1)] puis
E [X 2 ] = E [X (X − 1) + X ] = . . .
Dr Mory Ouattara (USP SDM) Probabilités et Statistiques 17 octobre 2022 77 / 1
Variables aléatoires Moments
Variance exemples
Inégalités
E (| X |)
P(| X |≥ a) ≤
a
Plus généralement, pour tout a > 0 et r > 0,
E (| X |r )
P(| X |≥ a) ≤
ar
Preuve
Inégalités
Preuve(Inégalité de Markov)
Z
r
E (| X | ) = | X |r fX (x)dx (1)
Z Z R
r
= | X | fX (x)dx + | X |r fX (x)dx (2)
]−a,a[ R−]−a,a[
Z
≥0+ arfX (x)dx = ar P(X ∈ R−] − a, a[) (3)
R−]−a,a[
= ar P(| X |> a) (4)
Inégalités
Inégalité de Bienaymé-Tchebychev
Soit X une variable aléatoire. Pour tout a > 0,
Var (X )
P(| X − E [X ] |≥ a) <
a2
avec probabilité 75 %, | X − E [X ] |≤ 2σ(X ).
Définition
Des variables aléatoires {X1 ; . . . ; Xn } sont indépendantes si, pour tous
B1 , . . . Bn ⊂ R
P(X1 ∈ B1 , . . . Xn ∈ Bn) = P(X1 ∈ B1 ) . . . P(Xn ∈ Bn )
Indépendance- Propriétés
Indépendance et espérance
Proposition
Si X1 , . . . , Xn sont des variables aléatoires indépendantes, alors
1 si leurs espérances sont bien définies
Théorème
Soit Xn , n ≥ 1 une suite de variables aléatoires indépendantes, et de
même loi, d’espérance m et de variance σ 2 . On définit la variable
aléatoires Xn , appelée moyenne empirique, par :
X1 + . . . + Xn
X¯n =
n
On a : Pour tout > 0, P(m − ≤ X¯n ≤ m + ) → 1
Si (An )n1 est une suite d’événements indépendants et qui ont même
probabilité p (par exemple, dans une suite de tirages à Pile-ou-Face,
An = { le n-ième tirage est Pile}, et p = 12 ), alors en posant
1 +...+1
Xi = 1Ai , on a X¯n = A1 n An
Dr Mory Ouattara (USP SDM) Probabilités et Statistiques 17 octobre 2022 86 / 1
Variables aléatoires Moments
X = a1 X1 + . . . + an Xn ∼ N (M, Σ2 )
n
X
M = E (X ) = ai mi
i=1
et
n
X
Σ2 = ai2 σi2
i=1
Loi du couple
Proposition
Soit (X , Y ) deux variables aléatoires. La loi du couple (X , Y ) est la
probabilité P(X , Y ) sur R2 qui vérifie : pour tous A, B ⊂ R ;
P(X , Y )(A × B) = P(X ∈ A; Y ∈ B) :
Les lois de X et Y se déduisent de P(X , Y ) : pour A ⊂ R,
Loi du couple
Calculs d’espérances
Statistiques
Quelle est la
difference entre un histogramme et digramme en
bâton
Dr Mory Ouattara (USP SDM) Probabilités et Statistiques 17 octobre 2022 108 / 1
Statistiques
Boxplot
Boxplot
Représentation numérique
Représentation numérique
Proposition
La moyenne est l’unique réel c qui minimise
n
X
(xi − c)2
i=1
Couple de variables
Définition
Soit X une variable aléatoire. Un échantillon de taille n de X est une
famille X1 , . . . , Xn de variables aléatoires indépendantes, de même loi
que X.
Statistiques simples
Statistiques simples
Proposition
Si X a pour espérance m et pour écart type σ, alors :
σ2
E (X¯n ) = m et var (X¯n ) =
n
n−1 2
E (S¯n2 ) = σ et E (Σ2n ) = σ 2
n
Estimateur
Estimateur
P(| Tn − θ |> α) → 0
Estimateur
Proposition
On suppose que X a pour espérance m et variance σ 2 .
La moyenne empirique est un estimateur sans biais et convergent
de m.
La variance empirique est un estimateur asymptotiquement sans
biais et convergent de σ 2 , et la variance empirique modifiée est
un estimateur sans biais et convergent de σ 2 .
Estimateurs-Risque quadratique
Comment mesurer la qualité et comparer deux estimateurs ?
Proposition
Le risque quadratique d’un estimateur Tn de θ est
On dit que l’estimateur Sn est meilleur que Tn si, quel que soit θ.
Construction d’estimateurs
Problème
Comment trouver un “bon” estimateur d’un paramètre θ ?
Construction d’estimateurs
Exemple
Exemple
Exemple
φ(θ) = L(x1 , . . . , xn , θ)
Intervalles de confiance
Tests
On souhaite, à partir de l’échantillon observé x1 , . . . , xn , savoir
si l’on peut raisonnablement conclure qu’une certaine hypothèse
sur la loi de X est fausse (en vue de prendre une décision).
L’hypothèse est appelée hypothèse nulle, et notée H0 . C’est une
hypothèse que l’on veut avoir peu de chance de rejeter si elle est
vraie (dans ce cas, on parle d’erreur de 1re espèce).
Un test est une condition sur l’échantillon x1 , . . . , xn pour
décider si on rejette H0 , ou si on considère les données
compatibles avec H0 . Le seuil de risque du test est la probabilité
d’erreur de première espèce :
α = P(rejet de H0 ) quand H0 est vraie
α doit être petit, en général on souhaite α = 5% (varie selon
l’enjeu du test).
Dr Mory Ouattara (USP SDM) Probabilités et Statistiques 17 octobre 2022 137 / 1
Statistiques Construction d’estimateurs
Tests
Produit de convolution
Produit de convolution
calculer f ∗ g avec
1 si x ∈ [−1, 3[
f (x) =
0 si x ≥ 1
et
x
2
si x ∈ [0, 2]
g (x) =
0 si x ≥ 1
Nombre de blessés
Le modèle suivant peut être utilisé pour représenter le nombre de
blessés dans les accidents de la circulation au cours d’un week-end.
Le nombre d’accidents suit une loi de Poisson de paramètre λ Le
nombre de blessés par accident, suit une loi de Poisson de
paramètreµ. Le nombre total de blessés est donc :
S = X1 + X2 + +XN S est la somme d’un nombre aléatoire de
variables de Poisson, indépendantes et de même loi.
1 Donner une expression pour P(S = s)
2 Calculer P(S = 0).
3 Calculer E(S) et V (S)