Echantillonnage Et Estimation
Echantillonnage Et Estimation
Echantillonnage Et Estimation
ESTIMATION
JM Nguyen Fev 09
1
Estimation statistique :
A partir des caractéristiques d’un échantillon , estimer celles de
la population dont est issu cet échantillon
Echantillonnage simple=proportionnelle
2
I ESTIMATIONS PONCTUELES
1 1 ( ∑ X i )²
La quantité S ² = × ∑ ( X i − m)² = {∑ X i2 − } de
n− 1 (n − 1) n
3
1.2 Estimation de proportions
4
1.3 Fluctuations d’échantillonnage
i1 m1
Population .
.
in mn
6
1.3.2 Fluctuation d’une fréquence
i1 p1
Population .
∏? .
in pn
n=∞
Plus n augmente, plus le tir est groupé et plus il se dirige vers sa cible
9
Jet d’un dé, probabilité d’avoir un six=1/6=16.66%
pq
Nb Jets Nb de 6 Fréquence
n=6 0/6 0% n
10
Un estimateur Tn du paramètre θ de la variable aléatoire X est
sans biais si E(Tn) = θ. La quantité E(Tn - θ) est appelé biais
11
Un estimateur Tn du paramètre θ de la variable aléatoire X est
efficace s’il est sans biais [E(Tn) = θ] et s'il est de variance
minimale parmi les estimateurs sans biais de θ.
12
II Estimation par intervalle de confiance
C’est donner les valeurs qui vont encadrer µ avec une probabililité
(1-α) de trouver µ.
Pr(m-k ≤ µ ≤ m+k) = (1-α)
2.1.1 La taille de l’échantillon est grand (n≥30)
13
Si on utilise la variable centrée réduite m− µ
Z=
σ
n
L’intervalle de confiance s’écrit
m− µ
Pr(-Zα/2 ≤ s ≤ +Zα/2 )=(1-α)
n
s s
Pr( m - Zα/2 ≤ µ≤ m + Zα/2 )=(1-α)
n n
14
Exemple1 : On tire au sort un échantillon de 100 individus d’une
population P.
Réponse :
m+/-1.96 √20²/100 65+/-1.96 x 2 [61.08 ; 68.92]
-1.96 +1.96
15
Exemple2 :On observe un échantillon de 100 dosages
la moyenne m est de 7.5 µmol/ml
la variance s² est de 4
Quel est l’IC95% de la moyenne µ ? 2.5% 95% 2.5%
-1.96 +1.96
7.5 - 0.392≤µ≤7.5+0.392
[7.108 ; 7.892]
16
2.1.2 La taille de l’échantillon est petit (n<30)
17
Exemple :
On observe un échantillon de 10 dosages
la moyenne m est de 7.5 µmol/ml
la variance s² est de 4
Quel est l’intervalle de confiance à 95% de la moyenne µ ?
-2.262 +2.262
t97,5%, 9= 2.262
7.5+/-2.262 x √(4/10)
7.5 – 1.43≤µ≤7.5+1.43
18
2.1.2.2 La variable aléatoire X ne suit pas une loi normale
On ne peut pas utiliser la loi normale ni la loi de Student.
Il existe d’autres méthodes...
19
2.2 Estimer une fréquence par un intervalle de confiance
L’intervalle de confiance d’une proportion ∏ pour un risque
consenti égal à α vaut
20
Exemple :
On cherche à estimer la fréquence d’enfants présentant des signes
d’obésité dans une population. On constitue un échantillon
représentatif de 1000 enfants et on a constaté que 120 sont obèses.
Estimer par un intervalle de confiance à 95% le taux d’enfants
obèses dans la population
Réponse :
p+/- Zα/2 √p(1-p)/n
p=120/1000 Z2.5%=1.96
√p(1-p)/n =√12%*88%/1000=0.0102
[12%-1.96*0.0102 12%+1.96*0.0102]
IC95%=[ 9.8%- 14.01%]
21
Si np ou nq trop petits
Loi binomiale exacte
22
2.3 Estimer une variance par un intervalle de confiance
2.3.1 Si n>=30
alors l’estimation s² de σ² suit approximativement une loi
normale de moyenne σ² et de variance 2σ4/n.
s² − σ ²
Pr(-Zα/2 ≤ ≤ +Zα/2 )=(1-α)
2σ 4
/n
s² s²
σ² ∈ 2
;
1−
2
× Zα / 2
1+ × Zα / 2 n
n
23
Exemple :
On veut estimer la variance des résultats d’un dosage biologique
dans une population. On suppose que la valeur du dosage suit une
loi normale.
On constitue un échantillon représentatif de 36 individus. La
moyenne est de 96 umol/ml et la variance 35² (1225).
s² s²
; 2
2
1+ × Zα / 2 1− × Zα / 2
n n
Réponse :
Borne supérieure variance : 35²/(1-1.96√2/36)=28.9
Borne inférieure variance : 35²/(1+1.96√2/36=39.5 24
2.3.2 Si n<30
Si X suit une loi normale, si s² est l’estimateur de σ² , alors
(n-1)s²/σ², suit une loi du Khi² à (n-1) ddl.
(n − 1)s ² (n − 1)s ²
σ² ∈ χ ² 1− α / 2
χ ²α /2
25
III Nombre de sujets nécessaires pour estimer avec une précision donnée
⇔ m-µ<E
On montre que si
26
Exemple :
On veut effectuer une estimation de la moyenne de la créatinine avec
une précision de +/-0.5 µmol/ml avec une probabilité de 95%.
Soit on connaît la variance de la créatinine dans la population, soit on
en fait une estimation, 25.
La taille de l’échantillon nécessaire est au moins égale à
(1.96² x 25 )/0.5² = 385 sujets
27
3.1 Cas d’une proportion
28