Aula 10
Aula 10
Metas
Introduzir novos conceitos fundamentais sobre a estatística inferencial, como a
estimação de parâmetros populacionais. Além disso, nesta aula será
apresentado um dos teoremas mais importantes da estatística: o Teorema do
Limite Central. Ao final, será mostrado como calcular o tamanho de uma
amostra, e quais são os elementos básicos para este cálculo.
Objetivos
32 34 39 36
35 37 40 39
42 40 33 33
33 38 30 31
36 36 35 40
38 35 37 37
37 31 39 34
33 37 32 34
38 36 39 37
36 33 37
35 36 35
16%
14%
12%
10%
8%
6%
4%
2%
0%
30 31 32 33 34 35 36 37 38 39 40 42
Olhando o Gráfico 1, você pode verificar quais são os números mais e menos
frequentes, ou seja, conhecer a distribuição da amostra que representa a
população em estudo. Essa é a ideia principal da “distribuição”: conhecer o
comportamento do conjunto de dados que se está trabalhando
1 – Distribuição Amostral
POPULAÇÃO PARÂMETROS:
AMOSTRAS ESTIMADORES:
Exemplo:
Vamos supor uma população X: 1, 2, 3, 4, 5. O tamanho desta população é
N=5.
Amostras 𝐗̅𝐢
1 (1, 1) 1,0
2 (1, 2) 1,5
3 (1, 3) 2,0
4 (1, 4) 2,5
5 (1, 5) 3,0
6 (2, 1) 1,5
7 (2, 2) 2,0
8 (2, 3) 2,5
9 (2, 4) 3,0
10 (2, 5) 3,5
11 (3, 1) 2,0
12 (3, 2) 2,5
13 (3, 3) 3,0
14 (3, 4) 3,5
15 (3, 5) 4,0
16 (4, 1) 2,5
17 (4, 2) 3,0
18 (4, 3) 3,5
19 (4, 4) 4,0
20 (4, 5) 4,5
21 (5, 1) 3,0
22 (5, 2) 3,5
23 (5, 3) 4,0
24 (5, 4) 4,5
25 (5, 5) 5,0
Observe que a média amostral 𝐗̅𝐢 varia de amostra para amostra, então
concluímos que 𝐗̅𝐢 é uma variável aleatória (ou seja, possui uma distribuição de
probabilidade). Se isso é verdade, podemos conhecer o comportamento (ou
distribuição) desta variável (média amostral).
̅
Gráfico 2 – Distribuição da variável X
6
0
1 1,5 2 2,5 3 3,5 4 4,5 5
25
1 (1,0 − 3,0)2 + ⋯ + (5,0 − 3,0)2
̅) =
𝑉(X 𝜎𝑋2̅ = ∑(𝑋̅𝑖 − 𝜇𝑋̅ )2 = =1
25 25
𝑖=1
Proposição 1
̅) = 𝜇𝑋̅ é igual à média µ populacional,
A média das médias amostrais ou 𝐸(X
̅) = 𝜇𝑋̅ = 𝜇.
ou 𝐸(X
̅) = 𝜇𝑋̅ = 𝜇=3.
Associando esta proposição ao exemplo, verificamos que 𝐸(X
Proposição 2
A variância da média amostral é igual à variância populacional divida pelo
𝜎2
̅) = 𝜎𝑋2̅ =
tamanho da amostra, ou 𝑉(X .
𝑛
2
̅) = 𝜎𝑋2̅ = 1 = 𝜎 = 2
Conforme vimos no exemplo, 𝑉(X 𝑛 2
amostral ̅
X será Normal com a mesma média populacional e uma variância n
vezes menor da populacional. Em outras palavras, a medida que o tamanho da
̅ diminui, ou seja, esse estimador torna-se
amostra aumenta, a variância de X
mais preciso quanto maior o tamanho da amostra.
Teorema do Limite Central
Exemplo:
Se na população X tem média 500 e desvio padrão 100, qual a probabilidade
de, tendo-se tirado uma amostra de 25 indivíduos, a média de minha amostra
estar entre 480 e 520?
População:
480 − 500
𝑍1 = = −1 ⇒ 𝑝(𝑍1 ) = 0,3413
20
520 − 500
𝑍2 = = +1 ⇒ 𝑝(𝑍2 ) = 0,3413
20
𝜎𝑋 100
= = 10
√𝑛 √100
480 − 500
𝑍1 = = −2 ⇒ 𝑝(𝑍1 ) = 0,4772
10
520 − 500
𝑍2 = = +2 ⇒ 𝑝(𝑍2 ) = 0,4772
10
Ou 95,44% das amostras possíveis de tamanho 100 terão médias entre 480 e
520.
Seja p conhecida. A população pode ser definida como uma variável X tal que:
Assim, P(X = 1) = p,
e a P(X = 0) = q = 1 - p,
sendo p + q = 1
x
p̂ = n, a proporção de sucessos na amostra.
pq
Variância: σ2p̂ = V(p̂) =
n
pq
p̂ ≈ N (p, )
n
p̂ − p
Z= ≈ N(0,1)
pq
√
n
Exemplo:
Suponhamos que eu esteja observando um conjunto de 5 indivíduos. A cada
um pergunto “em quem vai votar”. As respostas a essa pergunta eu codifico da
seguinte forma: =1 se for votar no Brizola e =0 se for votar em outro candidato
Suponhamos agora que obtive as seguintes respostas: eleitores: 𝑋 =
{1,0,1,1,0}.
a) Calcule a média de X;
b) Qual a proporção votando em Brizola?
Ou seja: 𝜇𝑋 = 𝑝 e vice-versa.
𝜎𝑝 = √𝑝(1 − 𝑝)
ATIVIDADE 1
Sendo:
𝜎𝑝 √0,40 × 0,60 0,49
= = ≈ 0,03
√𝑛 √300 17,3
P(34% < p̂ < 45%) = P(−2 < p̂ < 1,66) = 0,4773 + 0,4515 = 0,9288
FIM DA ATIVIDADE 1
2 - Intervalo de Confiança
Nível de Confiança
(1- )
2 2
-
̅.
2. Calcule a média amostral X
σ σ
̅ − zα
P (X <μ<̅
X + zα ) = (1 − α)
√n √n
ou
σ
̅ ± margem de erro = X
IC(1−𝛼) (μ) = X ̅ ± (z𝛼 )
√n
onde
σ
(z𝛼 ) é a margem de erro.
√n
Exemplo:
Suponha que para certa população saibamos que seu desvio padrão é 𝜎 = 3.
Extraindo uma amostra de n = 100 indivíduos obtemos uma média amostral de
̅ = 18. Qual o intervalo de confiança a 99% para a estimativa da média da
X
população?
99%
17,2 X
Ou seja, temos 99% de certeza que a média da população está entre 17,2 e
18,8, aproximadamente. A nossa margem de erro é de ± 0,77 com 99% de
confiança.
ATIVIDADE 2
Atende ao objetivo 3
RESPOSTA
FIM DA ATIVIDADE 2
𝑝𝑞
Lembrando que 𝑝̂ ≈ 𝑁 (𝑝, )
𝑛
ou
pq
IC(1−𝛼) (p) = p̂ ± margem de erro = p̂ ± (z𝛼 √ )
n
Exemplo:
Pouco antes da eleição presidencial de 1972 nos EUA, uma pesquisa Gallup
feita junto a 2000 eleitores acusou 760 favoráveis ao McGovern e 1240
favoráveis a Nixon. Calcular o intervalo de confiança de 95% para a proporção
na população (p) que votou a favor de McGovern.
pq √0,236
IC(1−𝛼) (p) = p̂ ± (z𝛼 √ ) = 0,38 ± 1,96 ≈ 0,38 ± 0,02
n √100
36% 40% X
(De fato, a proporção dos que votaram em McGovern naquela eleição foi de
38,2%).
pq √0,236
IC(1−𝛼) (p) = p̂ ± (z𝛼 √ ) = 0,38 ± 2,57 ≈ 0,38 ± 0,03
n √100
99%
35% 41% X
É assim que as estimativas das prévias são, ou melhor, deveriam ser feitas.
ATIVIDADE 3
RESPOSTA
FIM DA ATIVIDADE 2
3 - Tamanho da Amostra
𝑧𝛼 𝜎𝑋 𝑍 𝜎 2
𝛼 𝑋
√𝑛 = e𝑟𝑟𝑜
⟹ 𝑛 = ( e𝑟𝑟𝑜 )
Observe que o tamanho da amostra pode ser visto como função de:
1. O nível de confiança que eu quero ter na minha inferência: quanto maior o
nível de confiança (isto é 𝑍𝛼 ), maior o tamanho da amostra necessária;
3. O erro (absoluto) que eu estou disposto a incorrer: quanto maior o erro que
eu quiser admitir, menor a amostra que eu preciso.
Exemplo
Suponhamos que eu saiba (através do Censo, por exemplo) que a média de
escolaridade na minha população é de 8 anos e o desvio padrão é de 4 anos.
Eu quero fazer uma pesquisa e só admito um erro máximo na minha estimativa
de 0,5 ano. Pretendo trabalhar com um nível de confiança de 95%. Qual o
tamanho da amostra que eu necessito para a minha pesquisa?
1,96∗4 2
Resposta: 𝑛 = ( ) ≈ 246
0,5
2,57 ∗ 4 2
𝑛=( ) ≈ 423 𝑖𝑛𝑑𝑖𝑣í𝑑𝑢𝑜𝑠
0,5
Exemplo:
Imagine agora o caso de uma prévia eleitoral. Qual o número de casos na
minha amostra necessários para fazer inferência a 95% de confiança e
incorrendo num erro máximo de 3%?
ATIVIDADE 4
Atende ao objetivo 4
RESPOSTA
A pior situação possível é aquela em que 50% das pessoas se sentem seguras
e 50% inseguras. Com isso, o desvio padrão será o mais alto (maior
heterogeneidade). Então, supondo p=0,5, teremos:
𝑆𝑝 = √0,5(1 − 0,5) = √0,25 = 0,5
Assim,
2,58 ∗ 0,5 2
𝑛=( ) ≈ 666 𝑖𝑛𝑑𝑖𝑣í𝑑𝑢𝑜𝑠 𝑛𝑜 𝑚á𝑥𝑖𝑚𝑜.
0,05
FIM DA ATIVIDADE 4
4 - Conclusão
RESUMO
σ
̅ ± margem de erro = X
IC(1−𝛼) (μ) = X ̅ ± (z𝛼 )
√n
Leitura Recomendada