0% ont trouvé ce document utile (0 vote)
239 vues

Estimation Ponctuelle Et Par Intervalle de Confiance: Feuille de TP N 6

Ce document présente plusieurs exercices sur l'estimation ponctuelle et par intervalle de confiance. Il introduit notamment des estimateurs sans biais et convergents pour des lois normale et de Bernoulli, et compare leur précision via le risque quadratique. Un problème plus complexe est ensuite proposé pour estimer un paramètre à partir d'une loi particulière, en étudiant deux estimateurs et leurs intervalles de confiance asymptotiques.

Transféré par

Abdelhamid Jenzri
Copyright
© © All Rights Reserved
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
239 vues

Estimation Ponctuelle Et Par Intervalle de Confiance: Feuille de TP N 6

Ce document présente plusieurs exercices sur l'estimation ponctuelle et par intervalle de confiance. Il introduit notamment des estimateurs sans biais et convergents pour des lois normale et de Bernoulli, et compare leur précision via le risque quadratique. Un problème plus complexe est ensuite proposé pour estimer un paramètre à partir d'une loi particulière, en étudiant deux estimateurs et leurs intervalles de confiance asymptotiques.

Transféré par

Abdelhamid Jenzri
Copyright
© © All Rights Reserved
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
Vous êtes sur la page 1/ 5

Feuille de TP no 6

Estimation ponctuelle
et par intervalle de confiance

Certains exercices ci-dessous reprennent des éléments vus dans le TP no 4. En effet nous y avons vu de nombreux
exemples d’estimateurs (sans prononcer ce mot).

Exercice 1 – Intervalle de confiance pour l’espérance d’une loi Normale de variance connue. (HH)
Soient m ∈ R, σ > 0 et α ∈ ]0 ; 1[. Soit (Xi )i>1 une suite de variable aléatoires de loi N (m, σ 2 ) (on suppose que
n
1X
σ est connu). Pour tout n ∈ N∗ , notons Xn = Xi .
n
k=1
1) Justifier que Xn est un estimateur sans biais et convergent de m.
 
α uα σ uα σ
2) On note uα désigne l’unique antécédent de 1 − par Φ. Justifier que Xn − √ ; Xn + √ est un
2 n n
intervalle de confiance (non asymptotique) de niveau 1 − α pour m.
3) Pour α = 0.05 et pour différentes valeurs de m, σ et n, simuler N = 10000 fois Xn et compter la proportion
de fois où m tombe dans l’intervalle de confiance (on parle de niveau réel) et comparer cette proportion
avec 1 − α.

Exercice 2 – Intervalle de confiance asymptotique pour la paramètre d’une loi de Bernoulli. (HH)
Soient p ∈ ]0 ; 1[ et α ∈ ]0 ; 1[. Soit (Xi )i>1 une suite de variable aléatoires de loi B(p). Pour tout n ∈ N∗ ,
n
1X
notons Xn = Xi .
n
k=1
1) Justifier que Xn est un estimateur sans biais et convergent de p.
1
2) Montrer que p(1 − p) 6 .
 4 
1 1
3) Montrer que Xn − √ ; Xn + √ est un intervalle de confiance (non asymptotique) de niveau
2 nα 2 nα
1 − α pour p.
 
α uα uα
4) On note uα désigne l’unique antécédent de 1 − par Φ. Justifier que Xn − √ ; Xn + √ est un
2 2 n 2 n
intervalle de confiance asymptotique de niveau 1 − α pour p.
v
u n

u1 X √ Xn − p L
5) Pour tout n ∈ N , notons Sn = t (Xi − Xn ))2 . On admet que n −−−−−→ N avec
n Sn n→+∞
k=1
 
uα Sn uα Sn
N ,→ N (0, 1). Montrer alors que Xn − √ ; Xn + √ est un intervalle de confiance asympto-
n n
tique de niveau 1 − α pour p.
6) Pour α = 0.05 et pour différentes valeurs de p et de n, simuler N = 10000 fois X1 , . . . , Xn et compter :
• l’amplitude des deux premiers intervalles de confiance et l’amplitude moyenne (on parle d’incertitude)
du troisième.
• la proportion de fois où p tombe dans ces intervalles de confiance (on parle de niveau réel) et comparer
cette proportion avec 1 − α.
Quel intervalle de confiance est le meilleur ?

Lycée Carnot – H2B – TP6 1 Matthias Gorny


Problème – Adapté de ECRICOME 2021 et des oraux de l’ESCP 2005. (HHH) Toutes les variables
aléatoires considérées dans cet exercice sont définies sur le même espace probabilisé (Ω, A, P). Soit θ ∈ R∗+ . On
considère X une variable aléatoire admettant pour densité
( 2x
si x ∈ [0 ; θ]
fθ : x 7−→ θ2
0 sinon.

1) a) Justifier que fθ est bien une densité de probabilité.


b) Expliciter la fonction de répartition Fθ de X.
On considère une suite de variables aléatoires (Xn )n>1 indépendantes et de même loi que X.
2) Étude d’un premier estimateur de θ. Pour tout n ∈ N∗ , on note Mn = max{X1 ; X2 ; . . . ; Xn }.

a) Montrer que, si U ,→ U([0 ; 1]), alors θ U a la même loi que X.
b) Écrire une fonction en Python, appelée Simul_M, qui prend en entrée n et θ et qui renvoie une
simulation de Mn .
c) Modifier la fonction précédente pour qu’elle renvoie une liste contenant une réalisation de (M1 , . . . , Mn ).
On l’appellera Simul_MM.
On rappelle que, en Python, si L désigne une liste ou un vecteur et si i désigne un entier non nul,
alors L[:i] renvoie uniquement les i premières coordonnées de L.
d) Écrire un script en Python permet d’obtenir le graphique ci-dessus consistant en cinq réalisations
mutuellement indépendantes de (M1 , . . . , M100 ) dans le cas où θ = 1.

A partir de ce graphique, que peut-on conjecturer sur l’estimateur Mn ?


e) Montrer que, pour tout n ∈ N∗ , Mn est une variable aléatoire à densité. Donner en une densité.
f) Calculer les deux premiers moments de Mn .
g) Montrer que Mn est un estimateur biaisé de θ. Est-il asymptotiquement sans biais ?
h) Soit ε > 0 et n ∈ N∗ . Expliciter P(|Mn − θ| > ε). L’estimateur Mn est-il convergent ?
i) Calculer E((Mn − θ)2 ) (quantité appelée risque quadratique 1 de Mn ). Quel résultat retrouve-t-on ?
n
∗ 1X
3) Étude d’un second estimateur de θ. Pour tout n ∈ N , notons Xn = Xi .
n
i=1
a) Donner l’espérance et la variance de Xn .
b) Déduire de la variable aléatoire Xn un estimateur sans biais Zn de θ.
1. Le risque quadratique d’un estimateur mesure l’écart moyen entre l’estimateur est le paramètre qu’il estime. Plus il est petit, plus
l’estimateur est précis

2
c) Écrire une fonction en Python, appelée Simul_Z, qui prend en entrée n et θ et qui renvoie une
réalisation de Zn .
d) Modifier la fonction précédente pour qu’elle renvoie une liste contenant une réalisation de (Z1 , . . . , Zn ).
On l’appellera Simul_ZZ.
e) Écrire un script en Python permet d’obtenir le graphique ci-dessus consistant en cinq réalisations
mutuellement indépendantes de (Z1 , . . . , Z100 ) dans le cas où θ = 1.

A partir de ce graphique, que peut-on conjecturer sur l’estimateur Mn ?


f) Calculer E((Zn −θ)2 ) (quantité appelée risque quadratique1 de Zn ). L’estimateur Zn est-il convergent ?
4) Comparaison des deux estimateurs.
a) Comparer les risques quadratiques de Mn et Zn . Quelle méthode choisiriez-vous pour estimer la valeur
du paramètre θ ?
b) On rappelle que, en Python, la commande plt.hist(L,bins=50,density=True trace un histo-
gramme renormalisé avec 50 classes à partir des données de la liste L.
Écrire un script Python qui permet d’obtenir les graphiques ci-dessus consistant en un histogramme de
5000 réalisation de M100 et un histogramme de 5000 réalisation de Z100 dans le cas où θ = 1.

En quoi ces graphiques confortent-ils votre choix d’estimateur ?


5) Un premier intervalle de confiance asymptotique pour θ.

a) Montrer que la suite de variables aléatoires 2n(θ − Mn ) n>1 convergence en loi vers une variable
aléatoire dont on identifiera la loi et son (ses) paramètre(s).
b) Soit α ∈ ]0 ; 1[. Déduire de la question précédente un intervalle de confiance asymptotique de niveau
de confiance 1 − α pour le paramètre θ, construit à partir de Mn .

3
6) Un second intervalle de confiance asymptotique pour θ.
√ 
a) Montrer que la suite de variables aléatoires n(Zn − θ) n>1 convergence en loi vers une variable
aléatoire dont on identifiera la loi et son (ses) paramètre(s).
b) Soit α ∈ ]0 ; 1[. Déduire de la question précédente un intervalle de confiance asymptotique de niveau
de confiance 1 − α pour le paramètre θ, construit à partir de Zn .
7) Comparaison des deux intervalles de confiance asymptotiques.
a) Lequel de ces deux intervalles de confiance asymptotique vous semble le meilleur ?
b) En Python, si A désigne une matrice réelle, alors la commande np.max(A,0) renvoie un vecteur ligne
contenant le maximum de chaque colonne de A. La commande np.mean(A,0) renvoie quand à elle
un vecteur ligne contenant la moyenne de chaque colonne de A.
Recopier et compléter le script Python suivant :
1 n=100
2 N=10000
3 t h e t a =2
4 a l p h a =0.05
5 X = . . . . . . . . . . . . . . . . . . . . . . . #Une m a t r i c e de t a i l e nxN de r é a l i s a t i o n s de X
6 M = . . . . . . . . . . . . . . . . . . . . . . . #N r é a l i s a t i o n s de M_n
7 Z = . . . . . . . . . . . . . . . . . . . . . . . #N r é a l i s a t i o n s de Z_n
8
9 #Dé f i n i t i o n d e s b o r n e s d e s i n t e r v a l l e s de c o n f i a n c e :
10 aM = . . . . . . . . . . . . . . . . . . . . . . . . . . ; bM = . . . . . . . . . . . . . . . . . . . . . . . . . .
11 import s c i p y . s p e c i a l as sp
12 u=s p . n d t r i (1− a l p h a / 2 )#on a P h i ( u )=1−a l p h a /2
13 aZ = . . . . . . . . . . . . . . . . . . . . . . . . . . ; bZ = . . . . . . . . . . . . . . . . . . . . . . . . . .
14
15 #" I n c e r t i t u d e " : L a r g e u r moyenne d e s deux i n t e r v a l l e s de c o n f i a n c e s :
16 LM=np . mean (bM−aM)
17 LZ=np . mean ( bZ−aZ )
18
19 #" N i v e a u r é e l " : P r o p o r t i o n d ’ i n t e r v a l l e s de c o n f i a n c e s c o n t e n a n t t h e t a :
20 pM=(np . sum ( t h e t a <=bM)−np . sum ( t h e t a <aM) ) /N
21 pZ=(np . sum ( t h e t a <=bZ )−np . sum ( t h e t a <aZ ) ) /N
22
23 p r i n t ( " E s t i m a t i o n p o n c t u e l l e de t h e t a p a r l ’ e s t i m a t e u r M_n : "+s t r (M[ 0 ] ) )
24 p r i n t ( " I n t e r v a l l e s de c o n f i a n c e o b t e n u s a v e c l ’ e s t i m a t e u r M_n : " )
25 p r i n t ( ’ L a r g e u r moyenne : ’+s t r (LM)+ ’ e t n i v e a u r é e l : ’+s t r (pM∗ 1 0 0 ) )
26 p r i n t ( " E s t i m a t i o n p o n c t u e l l e de t h e t a p a r l ’ e s t i m a t e u r Z_n : "+s t r ( Z [ 0 ] ) )
27 p r i n t ( " I n t e r v a l l e s de c o n f i a n c e o b t e n u s a v e c l ’ e s t i m a t e u r Z_n : " )
28 p r i n t ( ’ L a r g e u r moyenne : ’+s t r ( LZ )+ ’ e t n i v e a u r é e l : ’+s t r ( pZ ∗ 1 0 0 ) )

Expliquer ce que font les commandes des lignes 20 et 21 du script.


c) Exécuter ensuite ce script. Commenter.
8) Un intervalle de confiance pour θ. On suppose dans cette question que n est un entier impair. Il existe
donc k ∈ N tel que n = 2k + 1. On admet l’existence de 2k + 1 fonctions ϕ1 , ϕ2 , . . . , ϕ2k+1 continues sur
R2k+1 à valeurs réelles telles que Y1 , Y2 , . . . , Y2k+1 définies par

∀i ∈ J1 ; 2k + 1K, Yi = ϕi (X1 , X2 , . . . , X2k+1 )

sont des variables aléatoires à densité de telle sorte que, pour tout ω ∈ Ω, Y1 (ω), Y2 (ω), . . . , Y2k+1 (ω) soit
un réarrangement par ordre croissante de X1 (ω), X2 (ω), . . . , X2k+1 (ω) :

∀ω ∈ Ω, Y1 (ω) 6 Y2 (ω) 6 · · · 6 Y2k+1 (ω).



En particulier Yk+1 est la médiane empirique de l’échantillon (X1 , . . . , X2k+1 ). On pose Tn = 2 Yk+1 .
On se donne α ∈ ]0 ; 1[. On définit la variable aléatoire Dn
  X n
θ
Dn = card i ∈ J1 ; nK Xi < √
= 1Xi <θ/√2
2 i=1

4
a) Justifier que Dn suit une loi binomiale dont on précisera les paramètres.
 
θ
b) Justifier que, pour tout i ∈ J1 ; nK, Yi > √ = [Dn < i].
2
1
c) Montrer que, pour tout ` ∈ J0 ; nK, P(Dn > n − `) = P(Dn 6 `). En déduire que P(Dn > k + 1) = .
  2
α
d) Montrer que l’ensemble En,α = i ∈ N P(Dn > i) 6 admet un minimum. On le note jα .
2
e) Montrer que jα > k + 1. En déduire que Yn−jα +1 6 Yjα presque sûrement.
 
θ
f) Déduire des questions précédentes que P Yn−jα +1 < √ 6 Yjα > 1 − α.
2
g) En déduire un intervalle de confiance pour θ au niveau de confiance 1 − α.
Vérifier que l’estimateur Tn prend presque sûrement ses valeurs dans cet intervalle.
h) Justifier que la fonction Python suivante prend en entrée α et n et renvoie le minimum de En,α .
1 d e f minE ( n , a l p h a ) :
2 i=n+1
3 p=1/2∗∗n
4 s=p
5 w h i l e s<=a l p h a / 2 :
6 i=i −1
7 p=p∗ i / ( n−i +1)
8 s=s+p
9 return i

i) En Python, si A désigne une matrice réelle, alors la commande np.sort(A,0) renvoie une copie de A
triée colonne par colonne, par ordre croissant (chaque colonne est triée indépendamment).
Compléter le script Python ci-dessous afin que son exécution retourne un vecteur MedEmp contenant p
réalisation de la médiane empirique Yk+1 .
1 k=50
2 n=2∗k+1
3 N=10000
4 t h e t a =2
5 a l p h a =0.05
6 X = . . . . . . . . . . . . . . . . . . . . . . . #Une m a t r i c e de t a i l e nxN de r é a l i s a t i o n s de X
7 Y=np . s o r t (X , 0 )#T r i c o l o n n e p a r c o l o n n e
8 j=minE ( n , a l p h a )#C a l c u l de j _ a l p h a
9
10 #Dé f i n i t i o n d e s b o r n e s d e s i n t e r v a l l e s de c o n f i a n c e :
11 aT = . . . . . . . . . . . . . . . . . . . . . . . . . . ; bT = . . . . . . . . . . . . . . . . . . . . . . . . . .
12
13 #" I n c e r t i t u d e " : L a r g e u r moyenne d e s deux i n t e r v a l l e s de c o n f i a n c e s :
14 LT=np . mean ( bT−aT )
15
16 #" N i v e a u r é e l " : P r o p o r t i o n d ’ i n t e r v a l l e s de c o n f i a n c e s c o n t e n a n t t h e t a :
17 pT=(np . sum ( t h e t a <=bT )−np . sum ( t h e t a <aT ) ) /N
18
19 p r i n t ( " E s t i m a t i o n p o n c t u e l l e de t h e t a p a r l ’ e s t i m a t e u r T_n : "
+s t r ( . . . . . . . . . . . ) )
20 p r i n t ( " I n t e r v a l l e s de c o n f i a n c e o b t e n u s a v e c l ’ e s t i m a t e u r T_n : " )
21 p r i n t ( ’ L a r g e u r moyenne : ’+s t r (LT)+ ’ e t n i v e a u r é e l : ’+s t r ( pT ∗ 1 0 0 ) )

Commenter et comparer avec les estimateurs asymptotiques. Si on prend une petite valeur de k
(après tout c’est un intervalle de confiance non asymptotique), qu’obtient-on ? Est-ce plus ou moins
intéressant ?

Vous aimerez peut-être aussi