Estimation Ponctuelle Et Par Intervalle de Confiance: Feuille de TP N 6
Estimation Ponctuelle Et Par Intervalle de Confiance: Feuille de TP N 6
Estimation ponctuelle
et par intervalle de confiance
Certains exercices ci-dessous reprennent des éléments vus dans le TP no 4. En effet nous y avons vu de nombreux
exemples d’estimateurs (sans prononcer ce mot).
Exercice 1 – Intervalle de confiance pour l’espérance d’une loi Normale de variance connue. (HH)
Soient m ∈ R, σ > 0 et α ∈ ]0 ; 1[. Soit (Xi )i>1 une suite de variable aléatoires de loi N (m, σ 2 ) (on suppose que
n
1X
σ est connu). Pour tout n ∈ N∗ , notons Xn = Xi .
n
k=1
1) Justifier que Xn est un estimateur sans biais et convergent de m.
α uα σ uα σ
2) On note uα désigne l’unique antécédent de 1 − par Φ. Justifier que Xn − √ ; Xn + √ est un
2 n n
intervalle de confiance (non asymptotique) de niveau 1 − α pour m.
3) Pour α = 0.05 et pour différentes valeurs de m, σ et n, simuler N = 10000 fois Xn et compter la proportion
de fois où m tombe dans l’intervalle de confiance (on parle de niveau réel) et comparer cette proportion
avec 1 − α.
Exercice 2 – Intervalle de confiance asymptotique pour la paramètre d’une loi de Bernoulli. (HH)
Soient p ∈ ]0 ; 1[ et α ∈ ]0 ; 1[. Soit (Xi )i>1 une suite de variable aléatoires de loi B(p). Pour tout n ∈ N∗ ,
n
1X
notons Xn = Xi .
n
k=1
1) Justifier que Xn est un estimateur sans biais et convergent de p.
1
2) Montrer que p(1 − p) 6 .
4
1 1
3) Montrer que Xn − √ ; Xn + √ est un intervalle de confiance (non asymptotique) de niveau
2 nα 2 nα
1 − α pour p.
α uα uα
4) On note uα désigne l’unique antécédent de 1 − par Φ. Justifier que Xn − √ ; Xn + √ est un
2 2 n 2 n
intervalle de confiance asymptotique de niveau 1 − α pour p.
v
u n
∗
u1 X √ Xn − p L
5) Pour tout n ∈ N , notons Sn = t (Xi − Xn ))2 . On admet que n −−−−−→ N avec
n Sn n→+∞
k=1
uα Sn uα Sn
N ,→ N (0, 1). Montrer alors que Xn − √ ; Xn + √ est un intervalle de confiance asympto-
n n
tique de niveau 1 − α pour p.
6) Pour α = 0.05 et pour différentes valeurs de p et de n, simuler N = 10000 fois X1 , . . . , Xn et compter :
• l’amplitude des deux premiers intervalles de confiance et l’amplitude moyenne (on parle d’incertitude)
du troisième.
• la proportion de fois où p tombe dans ces intervalles de confiance (on parle de niveau réel) et comparer
cette proportion avec 1 − α.
Quel intervalle de confiance est le meilleur ?
2
c) Écrire une fonction en Python, appelée Simul_Z, qui prend en entrée n et θ et qui renvoie une
réalisation de Zn .
d) Modifier la fonction précédente pour qu’elle renvoie une liste contenant une réalisation de (Z1 , . . . , Zn ).
On l’appellera Simul_ZZ.
e) Écrire un script en Python permet d’obtenir le graphique ci-dessus consistant en cinq réalisations
mutuellement indépendantes de (Z1 , . . . , Z100 ) dans le cas où θ = 1.
3
6) Un second intervalle de confiance asymptotique pour θ.
√
a) Montrer que la suite de variables aléatoires n(Zn − θ) n>1 convergence en loi vers une variable
aléatoire dont on identifiera la loi et son (ses) paramètre(s).
b) Soit α ∈ ]0 ; 1[. Déduire de la question précédente un intervalle de confiance asymptotique de niveau
de confiance 1 − α pour le paramètre θ, construit à partir de Zn .
7) Comparaison des deux intervalles de confiance asymptotiques.
a) Lequel de ces deux intervalles de confiance asymptotique vous semble le meilleur ?
b) En Python, si A désigne une matrice réelle, alors la commande np.max(A,0) renvoie un vecteur ligne
contenant le maximum de chaque colonne de A. La commande np.mean(A,0) renvoie quand à elle
un vecteur ligne contenant la moyenne de chaque colonne de A.
Recopier et compléter le script Python suivant :
1 n=100
2 N=10000
3 t h e t a =2
4 a l p h a =0.05
5 X = . . . . . . . . . . . . . . . . . . . . . . . #Une m a t r i c e de t a i l e nxN de r é a l i s a t i o n s de X
6 M = . . . . . . . . . . . . . . . . . . . . . . . #N r é a l i s a t i o n s de M_n
7 Z = . . . . . . . . . . . . . . . . . . . . . . . #N r é a l i s a t i o n s de Z_n
8
9 #Dé f i n i t i o n d e s b o r n e s d e s i n t e r v a l l e s de c o n f i a n c e :
10 aM = . . . . . . . . . . . . . . . . . . . . . . . . . . ; bM = . . . . . . . . . . . . . . . . . . . . . . . . . .
11 import s c i p y . s p e c i a l as sp
12 u=s p . n d t r i (1− a l p h a / 2 )#on a P h i ( u )=1−a l p h a /2
13 aZ = . . . . . . . . . . . . . . . . . . . . . . . . . . ; bZ = . . . . . . . . . . . . . . . . . . . . . . . . . .
14
15 #" I n c e r t i t u d e " : L a r g e u r moyenne d e s deux i n t e r v a l l e s de c o n f i a n c e s :
16 LM=np . mean (bM−aM)
17 LZ=np . mean ( bZ−aZ )
18
19 #" N i v e a u r é e l " : P r o p o r t i o n d ’ i n t e r v a l l e s de c o n f i a n c e s c o n t e n a n t t h e t a :
20 pM=(np . sum ( t h e t a <=bM)−np . sum ( t h e t a <aM) ) /N
21 pZ=(np . sum ( t h e t a <=bZ )−np . sum ( t h e t a <aZ ) ) /N
22
23 p r i n t ( " E s t i m a t i o n p o n c t u e l l e de t h e t a p a r l ’ e s t i m a t e u r M_n : "+s t r (M[ 0 ] ) )
24 p r i n t ( " I n t e r v a l l e s de c o n f i a n c e o b t e n u s a v e c l ’ e s t i m a t e u r M_n : " )
25 p r i n t ( ’ L a r g e u r moyenne : ’+s t r (LM)+ ’ e t n i v e a u r é e l : ’+s t r (pM∗ 1 0 0 ) )
26 p r i n t ( " E s t i m a t i o n p o n c t u e l l e de t h e t a p a r l ’ e s t i m a t e u r Z_n : "+s t r ( Z [ 0 ] ) )
27 p r i n t ( " I n t e r v a l l e s de c o n f i a n c e o b t e n u s a v e c l ’ e s t i m a t e u r Z_n : " )
28 p r i n t ( ’ L a r g e u r moyenne : ’+s t r ( LZ )+ ’ e t n i v e a u r é e l : ’+s t r ( pZ ∗ 1 0 0 ) )
sont des variables aléatoires à densité de telle sorte que, pour tout ω ∈ Ω, Y1 (ω), Y2 (ω), . . . , Y2k+1 (ω) soit
un réarrangement par ordre croissante de X1 (ω), X2 (ω), . . . , X2k+1 (ω) :
4
a) Justifier que Dn suit une loi binomiale dont on précisera les paramètres.
θ
b) Justifier que, pour tout i ∈ J1 ; nK, Yi > √ = [Dn < i].
2
1
c) Montrer que, pour tout ` ∈ J0 ; nK, P(Dn > n − `) = P(Dn 6 `). En déduire que P(Dn > k + 1) = .
2
α
d) Montrer que l’ensemble En,α = i ∈ N P(Dn > i) 6 admet un minimum. On le note jα .
2
e) Montrer que jα > k + 1. En déduire que Yn−jα +1 6 Yjα presque sûrement.
θ
f) Déduire des questions précédentes que P Yn−jα +1 < √ 6 Yjα > 1 − α.
2
g) En déduire un intervalle de confiance pour θ au niveau de confiance 1 − α.
Vérifier que l’estimateur Tn prend presque sûrement ses valeurs dans cet intervalle.
h) Justifier que la fonction Python suivante prend en entrée α et n et renvoie le minimum de En,α .
1 d e f minE ( n , a l p h a ) :
2 i=n+1
3 p=1/2∗∗n
4 s=p
5 w h i l e s<=a l p h a / 2 :
6 i=i −1
7 p=p∗ i / ( n−i +1)
8 s=s+p
9 return i
i) En Python, si A désigne une matrice réelle, alors la commande np.sort(A,0) renvoie une copie de A
triée colonne par colonne, par ordre croissant (chaque colonne est triée indépendamment).
Compléter le script Python ci-dessous afin que son exécution retourne un vecteur MedEmp contenant p
réalisation de la médiane empirique Yk+1 .
1 k=50
2 n=2∗k+1
3 N=10000
4 t h e t a =2
5 a l p h a =0.05
6 X = . . . . . . . . . . . . . . . . . . . . . . . #Une m a t r i c e de t a i l e nxN de r é a l i s a t i o n s de X
7 Y=np . s o r t (X , 0 )#T r i c o l o n n e p a r c o l o n n e
8 j=minE ( n , a l p h a )#C a l c u l de j _ a l p h a
9
10 #Dé f i n i t i o n d e s b o r n e s d e s i n t e r v a l l e s de c o n f i a n c e :
11 aT = . . . . . . . . . . . . . . . . . . . . . . . . . . ; bT = . . . . . . . . . . . . . . . . . . . . . . . . . .
12
13 #" I n c e r t i t u d e " : L a r g e u r moyenne d e s deux i n t e r v a l l e s de c o n f i a n c e s :
14 LT=np . mean ( bT−aT )
15
16 #" N i v e a u r é e l " : P r o p o r t i o n d ’ i n t e r v a l l e s de c o n f i a n c e s c o n t e n a n t t h e t a :
17 pT=(np . sum ( t h e t a <=bT )−np . sum ( t h e t a <aT ) ) /N
18
19 p r i n t ( " E s t i m a t i o n p o n c t u e l l e de t h e t a p a r l ’ e s t i m a t e u r T_n : "
+s t r ( . . . . . . . . . . . ) )
20 p r i n t ( " I n t e r v a l l e s de c o n f i a n c e o b t e n u s a v e c l ’ e s t i m a t e u r T_n : " )
21 p r i n t ( ’ L a r g e u r moyenne : ’+s t r (LT)+ ’ e t n i v e a u r é e l : ’+s t r ( pT ∗ 1 0 0 ) )
Commenter et comparer avec les estimateurs asymptotiques. Si on prend une petite valeur de k
(après tout c’est un intervalle de confiance non asymptotique), qu’obtient-on ? Est-ce plus ou moins
intéressant ?