Clase 5
Clase 5
Clase 5
Distribuciones en el muestreo.
Introducción
Noción y tipos de muestras
Estadísticos o Estimadores
Principales Distrib. en el muestreo
Teorema Central del Límite
Ejercicios
Introducción
Los análisis estadísticos que se realizan en el mundo real tienen como
objetivo estudiar las propiedades características de las poblaciones (cuyos
individuos pueden ser personas, animales o cosas).
Pero estudiar todos los individuos de la población supone:
• Elevados costes económicos
• Mucho tiempo de trabajo
• Errores de medición
• En algunos casos, la destrucción del elemento objeto del estudio (vida
media de un motor, tiempo de duración de determinado tipo de
cubiertas de automóvil,…)
Se recurre entonces a considerar conjuntos de elementos representativos de
dicha población, llamadas muestras, cuyas propiedades nos permiten
inducir las propiedades que nos interesan de la población.
El estudio de poblaciones mediante muestras adecuadas tomadas de ellas
constituye la llamada Inferencia Estadística, Estadística Inductiva, Teoría de
la Estimación o Teoría de Muestras
1
Introducción
Para inferir resultados de las poblaciones a partir de datos de las
muestras cabe distinguir dos formas generales de actuar:
Estimación: Entenderemos por estimación de un parámetro poblacional
al cálculo del valor de este a través de una muestra. Por ejemplo, si
pretendemos determinar el valor de la media poblacional, podríamos
calcular la media de la muestra elegida y atribuir este valor a aquella.
Para que esta estimación sea correcta debe cumplir ciertas condiciones.
Prueba o contraste de hipótesis: En este caso se realiza una conjetura
(hipótesis) sobre el valor del parámetro poblacional desconocido,
basándonos en informaciones o conocimiento previo del problema y se
trata de elaborar una regla que nos permita dilucidar sobre su validez.
Esta regla se denomina contraste o test de la hipótesis.
Ambas formas de actuar para producir una inferencia son
complementarias.
2
Noción y tipos de muestras
Nosotros supondremos a partir de ahora que utilizamos siempre el muestreo
aleatorio simple:
Estadísticos o Estimadores
Un parámetro es una caracterización numérica de la distribución de la
población (esperanza, varianza,…). Es un valor fijo y desconocido,
puesto que para conocerlo necesitaríamos estudiar toda la población.
Dada una m.a.s. X1, X2, ..., Xn, de una población en la que se estudia la
variable aleatoria X, se define Y = H(X1, X2, ..., Xn), donde H es cualquier
función real, como un estadístico o estadigrafo, que, para cada
realización de la muestra, definida por el n-tuplo (x1, x2, ... xn) toma un
valor diferente y = H(x1, x2, ..., xn).
3
Estadísticos o Estimadores
De acuerdo con esta definición un estadigrafo es una variable aleatoria
que, como tal, tiene una distribución de probabilidad (con su media, su
varianza, etc…), que se conoce como distribución en el muestreo o
distribución muestral. Así, si el estadístico es la media muestral, podremos
hablar de la distribución en el muestreo de la media muestral, y de la
media o esperanza de la distribución en el muestreo de la media muestral.
La distribución muestral de un estadístico depende del tamaño de la
población, del tamaño de las muestras y del método de selección de estas
últimas.
En el resto de este tema se estudiarán varias de las distribuciones
muestrales de uso más frecuente en Estadística. Las aplicaciones de estas
distribuciones muestrales a problemas de inferencia estadística se verán en
los temas siguientes.
Estadísticos o Estimadores
Ejemplo:
Tenemos una población con los siguientes N = 3 elementos: X = {1, 2 y 3}.
Donde µ =2 σ2 = 0,67.
Se extraen muestras de n = 2 elementos:
Con reposición, tenemos 9 posibles muestras:
(1, 1); (1, 2); (1, 3); (2, 1); (2, 2); (2, 3); (3, 1); (3, 2); y (3, 3).
Sin reposición, tenemos 6 posibles muestras:
(1, 2); (1, 3); (2, 1); (2, 3); (3, 1); y (3, 2).
En cada una de las muestras pueden calcularse los correspondientes
estadísticos descriptivos:
Por ejemplo, con reposición:
Las medias muestrales ( X) serían: 1; 1,5; 2; 1,5; 2; 2,5; 2; 2,5; y 3
Las varianzas muestrales (S2) serían: 0; 0,25; 1; 0,25; 0; 0,25; 1; 0,25; y 0
4
Estadísticos o Estimadores
Por tanto, los estadísticos son variables aleatorias que pueden adoptar
diferentes valores y que tienen su propia distribución de probabilidad.
DISTRIB. MUESTREO
Media Muestral X
Proporción Muestral p
Cuasivarianza muestral S2
Diferencias y sumas
5
Principales Distrib. en el muestreo
Distribución de muestreo de la media muestral:
Esta estadística tiene un papel muy importante en problemas de toma de
decisiones para medias poblacionales desconocidas.
1 n 1 n
E [X ] = µ X = E ∑ xi = ∑ E [X i ] = ⋅ n ⋅ E [X ] = E [X ] = µ
1
n i =1 n i =1 n
La varianza de la distribución de la media muestral, que se simboliza por σ ,
2
x
1 n 1 2 n 1 n
1 σ2
σ X2 = σ 2 ∑ xi = 2 σ ∑
n i =1 n i =1
xi = 2
n
∑ σ X2 =
i =1
i
n2
⋅ n ⋅ σ 2
=
n
La desviación típica (error típico) de la distribución de la media muestral
sería:
σ
σ X = σ X2 =
n
Ver ejemplo inicial
6
Principales Distrib. en el muestreo
Si la variable original sigue una distribución Normal, la media muestral
sigue también una distribución Normal
X ∈ N (µ ,σ 2 ) ⇒ (
X ∈ N µ ,σ
2
n
)
Si la variable original sigue una distribución cualquiera, pero el tamaño de
la muestra es suficientemente grande (≥ 30), dado que la media muestral es
igual a la suma de variables independientes de igual media y varianza,
aplicando el Teorema Central del Límite (que veremos a a continuación),
podemos decir que el estadístico media muestral se distribuye también
según una Normal, como antes.
7
Principales Distrib. en el muestreo
X + X 2 + ...+ X n X
∑X i
pˆ = 1 = = i=1
n n n
donde cada Xi se distribuye como una Bernoulli(p).
X = nº de éxitos en n intentos, por lo que X ∈ B(n,p), cuya media sería n.p, y
desviación típica sería npq
8
Principales Distrib. en el muestreo
La media (esperanza) de la distribución de esta proporción muestral, así
como su varianza y su desviación típica (error típico) vienen dadas por las
siguientes expresiones:
p⋅q p⋅q
E ( pˆ ) = p ⇒ σ p2ˆ = ⇒ σ pˆ =
n n
La distribución en el muestreo del estadístico proporción muestral de éxitos
seguiría una Binomial, cuya media y varianzas son los indicados arriba, que
no es más que el resultado de dividir por n los correspondientes a la
distribución Binomial de la variable original X (de hecho las probabilidades
asociadas al estadístico p̂ se obtienen de la tabla de la binomial de X.
9
Principales Distrib. en el
muestreo
Aproximación a la normal
( -µ)
n 2
σˆ = ∑ X i
2
i=1 n
en donde X1, X2, ..., Xn constituyen una muestra aleatoria de una
distribución normal con media µ y varianza σ2 desconocida y lo que
queremos es determinar una distribución de muestreo que permita hacer
inferencias sobre σ2 con base a σ̂ 2 como la hemos definido.
10
Principales Distrib. en el muestreo
Desde un punto de vista práctico, la varianza muestral tal y como la hemos
definido tiene poco uso, ya que es muy raro que se conozca el valor de la
media poblacional µ. De acuerdo con lo anterior, si se muestrea una
distribución normal con media µ y varianza σ2, la varianza muestral se
tendría que definir como: n
∑ (X i − X )2
V (X ) = i =1
n
donde se ha reemplazado la media desconocida µ por la muestral X , dando
origen a la presencia de otra estadística en la definición de V(X).
11
Principales Distrib. en el muestreo
Distribuciones en el muestreo de diferencias y sumas:
Supongamos que estamos interesados en estudiar dos poblaciones. Para
cada muestra de tamaño n1 de la primera, calculamos un estadístico T1; eso
da una distribución de muestreo para T1, cuya media y desviación típica
denotaremos por E[T1] y σT1. Del mismo modo, para una muestra de
tamaño n2 de la segunda, calculamos un estadístico T2; eso da una
distribución de muestreo para T2 cuya media y desviación típica
denotaremos por E[T2] y σT2.
[ ] [ ] [ ]
E X 1 − X 2 = E X 1 − E X 2 = µ1 - µ 2 σ ( X - X ) = σ 2X + σ 2X =
1 2
σ 12 + σ 22
1 2
n1 n2
A veces es útil hablar también de Distribución de muestreo de la suma de
estadísticos.
12
Teorema Central del Límite
Si X es la media de una muestra aleatoria de tamaño n que se toma de una
población con cualquier distribución (oblicua a la derecha, oblicua a la
izquierda, con forma de tina, etc...), cuya media es µ y varianza finita σ2,
entonces la forma límite de la distribución de:
X -µ
Z=
σ
n
conforme n → ∞, es la distribución normal estándar N (0,1).
Ejercicios
Ejercicio 5.1
Un partido político cree que el 60% del electorado está a favor de su
programa. Como su líder encuentra que esta predicción es demasiado
optimista decide hacer un sondeo con una muestra de 90 personas.
¿Cuál será la probabilidad de que como máximo 60 personas estén a
favor de su partido?
Ejercicio 5.2
Disponemos de los datos del I.N.E. (Instituto Nacional de Estadística)
sobre el aumento del empleo durante el año 98, el cual se encuentra en
un 45%. Si tomamos una muestra aleatoria de 200 ciudadanos. ¿Cuál es
la probabilidad de que más del 50% tenga empleo?
13
Ejercicios
Ejercicio 5.3
La variable X se distribuye normalmente con media 50 y desviación
típica 12. Si extraemos una muestra aleatoria simple de 16 alumnos:
1) Si se extrae un sujeto al azar, ¿Cuál es la probabilidad de que
obtenga al menos una puntuación de 45?
2) ¿Cuál es la probabilidad de que su media aritmética sea menor de
58?
3) ¿Cuál es la probabilidad de que su media aritmética sea como
mínimo 45?
4) ¿Qué valores debería tomar la media aritmética para que exista
una probabilidad de 0,38 de encontrar valores entre ellos?
5) ¿Qué tamaño tendría que tener la muestra para que la
probabilidad de encontrar medias superiores a 52 fuese 0,2578?
14