Examen 2023 2024

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 4

Sorbonne Université 11 janvier 2024

Master Mathématiques et Applications Aucun document autorisé


MU4MA015 : Statistique Durée : 3 heures

Examen

Rappels
— Il sera tenu compte du soin apporté à la présentation et à la rédaction. Si vous n’arrivez pas à
démontrer un résultat, vous pouvez l’admettre pour la suite de l’exercice.
— Pour a > 0 et b > 0, la loi Gamma(a, b) a pour densité par rapport à la mesure de Lebesgue sur R
la fonction
ba a−1 −bx
x 7→ x e 1x>0 .
Γ(a)
La loi inverse-Gamma IG(a, b) est la loi de l’inverse d’une variable aléatoire de loi Gamma(a, b), et
a pour densité par rapport à la mesure de Lebesgue sur R la fonction
ba −a−1 −b/x
x 7→ x e 1x>0 .
Γ(a)

Exercice 1 (9 points)
Soient a > 0 et n ≥ 2. On considère le cadre bayésien suivant :

θ ∼ Π = IG(a, 1)
 ⊗n
1
X = (X1 , . . . , Xn ) θ ∼ E ,
θ

et la fonction de perte ` : (R∗+ )2 → R+ définie par


1
∀(θ, t) ∈ (R∗+ )2 , `(θ, t) = (t − θ)2 .
θ2
1. Soit Z ∼ IG(c, d), avec c > 0 et d > 0.
d 2
(a) Montrer que si c > 2, alors E[Z] = et Var(Z) = (c−1)d2 (c−2) .
c−1
1
? En déduire E Z et Var Z1 .
1 
(b) Quelle est la loi de Z
1+nX n
2. Donner la loi a posteriori Π[ · X]. Vérifier que l’espérance a posteriori mX vaut a+n−1 et préciser
la variance a posteriori vX .
3. Déterminer un estimateur de Bayes pour la fonction de perte ` et l’a priori Π. On le notera T ∗ .
4. Montrer que pour tout θ > 0, on a
 2 !
∗ 1 1
R(θ, T ) = n+ − (a + 1) ,
(a + n + 1)2 θ

où R est la fonction de risque associée à la fonction de perte `.

1/9
5. En déduire le risque de Bayes RB (Π) pour l’a priori Π et la perte `.
6. Pour γ > 0, on pose Tγ (X) = γX n .
(a) Calculer la fonction de risque de Tγ (pour la perte `). Que vaut Rmax (Tγ ) ?
(b) Déterminer γ ∗ = arg minγ>0 Rmax (Tγ ).
(c) Montrer que Tγ ∗ est minimax.
7. Soit θ0 > 0.
(a) Montrer que, sous Pθ⊗n
0
, on a
nvX −→ θ02 .
P

(b) Montrer que, sous Pθ⊗n


0
, on a
√ L
n (mX − θ0 ) −→ N (0, θ02 ) .

(c) Montrer que pour toute suite (Mn )n≥1 avec Mn → +∞, on a, sous Pθ⊗n
0
:
 
Mn P
P |θ − θ0 | > √ X −→ 0 .
n

Exercice 2 (7,5 points)


On considère une variable aléatoire X de densité fθ définie par

3x2
fθ (x) = 1 (x),
θ3 [0,θ]
avec θ > 0 un paramètre inconnu que l’on souhaite estimer. Pour ce faire, on dispose de variables aléatoires
i.i.d. X1 , . . . , Xn de même loi que X.
1. Le modèle est-il régulier ?
2. Calculer et représenter la fonction de répartition F de la variable aléatoire X.
3. Déterminer la médiane de la loi de X et en déduire un estimateur θbn de θ. Préciser sa normalité
asymptotique. Pour 0 < α < 1, donner un intervalle de confiance de niveau asymptotique (1 − α).
4. Déterminer l’estimateur du maximum de vraisemblance.
5. Soit X(n) = max1≤i≤n Xi . Construire un intervalle de confiance de niveau (1 − α) de la forme
[X(n) ; cα,n X(n) ], où cα,n ≥ 1 est une constante que l’on précisera.
6. Déduire de la question précédente un test au niveau α pour les hypothèses :

H0 : θ = 1 contre H1 : θ 6= 1.

Soit x(n) une réalisation de X(n) . Calculer la p-valeur associée.


7. Montrer que n(θ − X(n) ) tend en loi vers une loi exponentielle dont on précisera le paramètre.
8. Soient λ > 0 et T ∼ E λθ . Déterminer qα,θ tel que P(0 ≤ T ≤ qα,θ ) = 1 − α. Déduire de ceci et de


la question précédente un intervalle de confiance de niveau asymptotique (1 − α) pour θ.


On prendra pour convention [A, B] = ∅ lorsque B < A et on vérifiera que l’intervalle de confiance
obtenu est de la forme [X(n) ; dα,n X(n) ], où dα,n est une constante (supérieure à 1 à partir d’un certain
rang) que l’on précisera.
9. Pour α ∈ ]0, 1[ fixé et lorsque n tend vers l’infini, donner des développements asymptotiques de la
forme cα,n ∼ 1 + cα /n et dα,n ∼ 1 + dα /n. Commenter.

2/9
10. Entre X(n) et θbn , quel estimateur choisissez-vous ?

Exercice 3 (3,5 points)


Les questions 1. et 2. de cet exercice sont indépendantes.
1. On dispose du tableau de données suivant, représentant des réalisations x1 , . . . , xn de variables
aléatoires réelles X1 , . . . , Xn i.i.d., et on souhaite tester (au niveau α ∈ ]0, 1[)

H0 : θ ≤ 1 contre H1 : θ > 1

dans le modèle P = {N (θ, 1), θ ∈ R}.


print(x.shape)
print(x[:10])

(200,)
[ 3.25617103 -1.24290386 0.21805856 -0.72901134 2.81435003 2.29702943
1.68190239 1.17001241 -0.76642552 1.7031285 ]

(a) On note Φ la fonction de répartition de N (0, 1). Par quoi faut-il remplacer ??? et $$$ pour
1 Pn
calculer la réalisation du test T (x) = 1xn >1+ √1 Φ−1 (1−α) (avec xn = n i=1 xi ) et la p-valeur
√ n
associée α0 (x) = 1 − Φ( n(xn − 1)) ?
alpha = 0.05
threshold = 1 + stats.norm.ppf(1-alpha) / np.sqrt(n)
test = ??? > threshold
alpha0 = 1 - $$$
print(test, alpha0)

False 0.4135433062246249

(b) Au vu du résultat, rejette-t-on H0 ?


2. (a) Expliquer en quoi le script suivant échantillonne approximativement suivant la loi de densité
proportionnelle à la fonction f : (x, y) 7→ y 2 e−(1+x)y 1x≥0, y≥0 . On détaillera la réponse.
n = 5000

x, y = 0, 1
sample = [(x, y)]
for i in range(n):
x = stats.expon(scale=1/y).rvs()
y = stats.gamma(a=3, scale=1/(1+x)).rvs()
sample.append((x, y))
sample = np.asarray(sample)

(b) Justifier l’illustration ci-dessous.


u = np.linspace(0, 10, num=200)

3/9
plt.hist(sample[:, 1], density=True, bins='auto')
plt.plot(u, stats.gamma(a=2, scale=1).pdf(u))

4/9

Vous aimerez peut-être aussi