Teoria de Limite Central Intervalos 1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

Germán 

Jesús Rubio Luna  Catedrático de Matemáticas  del IES Francisco Ayala 

Distribución de las medias, proporciones muestrales y diferencias de


medias.
Nota.- Una vez obtenida la muestra de la población, y realizado el estudio sobre ella,
llega la fase en que hay que obtener conclusiones sobre toda la población. Nosotros
vamos a estimar la media de la población, o la proporción de individuos de esa pobla-
ción que tienen una determinada ó la diferencia de medias .
Distribución de las medias muestrales
Vamos a considerar ahora todas las muestras posibles de tamaño n que se puedan
extraer de una población, y la variable aleatoria X formada por sus correspondientes
medias muestrales. Si llamamos “” y “” a la media y la desviación típica de la po-
blación (respectivamente), y siendo X la variable aleatoria formada por las medias
muestrales, entonces se verifica:
(1) La media de X es , es decir ( X ) = .
(2) La desviación típica de X es /√(n), es decir ( X ) = /√(n). (Este resultado sólo
es válido para poblaciones infinitas o para poblaciones finitas en las que el mues-
treo se ha hecho con reemplazamiento).

(3) Si X → N(,) , entonces X → N( , ). Distribución muestral de medias
n
(4) (Teorema Central del Límite).- Si X no sigue una ley normal, pero n ≥ 30,

entonces se puede considerar que X → N( , )
n
 Una población está formada por sólo cinco elementos, con valores 3, 5, 7, 9 y 11.
Consideramos todas las muestras posible de tamaño 2 con reemplazamiento que puedan
extraerse de esta población. Se pide calcular:
a) La media de la población.
b) La desviación típica de la población
c) La media de la distribución muestral de medias.
d) La desviación típica de la distribución muestral de medias, es decir, el error típico de las

Muestreo. Inferencia. Intervalos de Confianza    4 
Germán Jesús Rubio Luna  Catedrático de Matemáticas  del IES Francisco Ayala 

medias.
sol
a) La media de la población es  = (3 + 5 + 7 + 9 + 11)/5 = 35/5 = 7
b) La desviación típica de la población es:

(3-7)2  (5-7)2  (7-7)2  (9-7)2  (11-7)2


= = 8 = 2,8284
5
Construyamos la distribución muestral de medias y, para ello, calculamos la media de to-
das las muestras posibles con reemplazamiento de tamaño 2 que son 25. Los resultados
pueden verse en la tabla siguiente:
MUESTRAS
Elementos 3 3 3 3 3 5 5 5 5 5 7 7 7 7 7 9 9 9 9 9 11 11 11 11 11
3 5 7 9 11 3 5 7 9 11 3 5 7 9 11 3 5 7 9 11 3 5 7 9 11
Media de
la 3 4 5 6 7 4 5 6 7 8 5 6 7 8 9 6 7 8 9 10 7 8 9 10 11
muestra x i

La distribución muestral de medias puede verse en la tabla que sigue.


Media de la Muestra x i Numero de muestras Probabilidad p( x i )
x1 =3 1 1/25
x2 =4 2 2/25
x3 = 5 3 3/25
x4 = 6 4 4/25

x5 = 7 5 5/25

x6 = 8 4 4/25
3 3/25
x7 = 9
2 2/25
x8 = 10
1 1/25
x9 = 11

Podemos representarla poniendo en abscisas las medias muestrales y en ordenadas las


probabilidades.
c) La media de la distribución muestral de medias (media de medias) es:
11
=  x  p(x ) =3(1/25) + 4(2/25) + ...... + 10(2/25) + 11(1/25) = 175/25 = 7
i 1
i i

d) La desviación típica de la distribución muestral de medias es:

Muestreo. Inferencia. Intervalos de Confianza    5 
Germán Jesús Rubio Luna  Catedrático de Matemáticas  del IES Francisco Ayala 

11
1325
x
2
= i  p(x i )  x =  72 = 4 = 2
i 1 25

Cuando la población es infinita o las muestras se extraen con reemplazamiento, se verifi-


ca:

x =  y x =
n
 Las estaturas de 1200 estudiantes de un centro d enseñanza superior se distribuyen
normalmente con media 1’72 y desviación típica 0’9 m. Si se toman 100 muestras de 36
estudiantes cada una, se pide:
a) La media y la desviación típica esperada de la distribución muestral de medias.
b) ¿En cuantas muestras cabría esperar una media entre 1’68 y 1’73 m?
c) ¿En cuantas muestras es de esperar que la media sea menor que 1’69 m?
sol
a) La media y la desviación típica esperada de la distribución muestral de medias es:
 0,9
 x =  = 1’72m y x = = = 0’15 m
n 36
Por ser el tamaño muestral mayor que 30 aplicamos el teorema central del límite, que
afirma que la distribución muestral de medias se aproxima a una distribución normal:

N(, )
n
b) Tipificamos los valores 1,68 y 1,73 según la distribución N(1’72, 0’15), obteniendo.
z1,68 =(1’68 – 1’72)/0’15 = - 0’27 y z1,73 =(1’73 – 1’72)/0’15 = 0’07
La probabilidad de muestras con medias entre 1’68 y 1’73 m es:
p(1’68  X  1’73) = p(-0’27  Z  0’07) = p(Z  0’07) - [1 - p(Z  027)] =
= 0’5279 - (1 – 0’6064) = 0’1343
El número de muestras esperado es 100 .0’1343 = 13 muestras.
c) Tipificamos el valor 1’69 m que se distribuye según N(1’72, 0’15), obteniendo:
z1,69 =(1’69 – 1’72)/0’15 = - 0’2
La probabilidad de muestras con medias menores que 1’69 m es:
p(Z  - 0’2) = 1 - p(Z  0’2) = 1 – 0’5793 = 0’4207
El número de muestras esperado es 100 .0’4207 = 42 muestras.

Distribución de las proporciones muestrales


Nota.- Vamos a estudiar ahora de todas las muestras posibles de tamaño n, la propor-
ción de sus individuos que tienen una determinada característica. Llamaremos p al va-

Muestreo. Inferencia. Intervalos de Confianza    6 
Germán Jesús Rubio Luna  Catedrático de Matemáticas  del IES Francisco Ayala 

lor de esa proporción en toda la población, y P a la variable aleatoria constituida por


las proporciones muestrales. Entonces también se puede demostrar que:
(1) La media de P es p, es decir (P) = p.

pq pq
(2) La desviación típica de P es , es decir (P) = , donde q = 1 - p
n n

pq
(3) Si n ≥ 30, entonces se puede considerar que P → N(p, ), que es la distri-
n
bución muestral de proporciones.
 Una población está formada por los elementos 1, 2, 4 y 6.
a) Calcula la proporción p de cifras impares.
b) Para cada una de las muestras con reemplazamiento de tamaño dos, calcula la propor-
ción P de cifras impares.
c) Calcula la media y la desviación típica de la distribución muestral de proporciones.
sol
a) La proporción de cifras impares es p = 1/4 = 0,25
b) La proporción de cifras impares de cada una de las muestras puede verse en la tabla.
Muestras 1 1 1 2 14 16 21 22 24 26 41 42 44 46 61 62 64 66
Proporción
1 0,5 0,5 0,5 0,5 0 0 0 0,5 0 0 0 0,5 0 0 0
(P)
c) La media de las proporciones anteriores es:
(P) = ( 1 + 0,5 + 0,5 + 0,5 + 0,5 + 0,5+ 0,5 + 0 + ...+ 0 )/16 = 0’25
La desviación típica de la distribución de proporciones es:

12  0,52  0,52  0,52  0,52  0,52  0,52  02  ...  02


(P) =  (0,25)2 = 0’3062
16
Cuando la población es finita o las muestras se extraen con reemplazamiento en una po-
blación finita con proporciones p y q, se verifican las relaciones siguientes:
pq
(P) = p = 0’25 y (P) = = 0’3062
n
 Una máquina fabrica piezas de precisión. En su producción habitual fabrica un 3% de
piezas defectuosas. Un cliente recibe una caja de 500 piezas procedentes de la fábrica.
a) ¿Cuál es la probabilidad de que encuentre más del 5% de piezas defectuosas en la ca-
ja?
b) ¿Cuál es la probabilidad de que encuentre menos de un 1% de piezas defectuosas?
sol

Muestreo. Inferencia. Intervalos de Confianza    7 
Germán Jesús Rubio Luna  Catedrático de Matemáticas  del IES Francisco Ayala 

La distribución muestral de proporciones admite como media y desviación típica:


pq (0,03)(0,97)
(P) = p = 0,03 y (P) = = = 0’0076
n 500
La distribución muestral se distribuye según la normal N(0’03; 0’0076), dado que el tama-
ño de las muestras es superior a 30. Las probabilidades pedidas son:
0,05-0,03
a) p(P>0’05)=1- p(P0’05)=1- p( Z )=1-p(Z2’63)=1-0’9957=0’0043
0,0076
0,01-0,03
b) p(P < 0’01) = p( Z< ) = p(Z < -2’63) = 1 - p(Z < 2’63) = 1-0’9957 = 0’0043
0,0076
Distribución muestral de diferencia de medias
Nota.- Cuando estudiarnos dos colectivos conjunta y comparativamente se consideran: 1
la media del primer colectivo, 1 su desviación típica y n1 el número de elementos de una
muestra; así como 2 , 2 y n2 las del segundo colectivo.
Nota.- Las relaciones existentes entre los estadísticos de la distribución muestral y los
parámetros de las poblaciones, así como la relación entre las distribuciones de las pobla-
ciones y la distribución muestral de diferencia de medias se muestran a continuación.
Nota.- Si dos poblaciones siguen sendas distribuciones normales N(1,1) y N(2,2), o
bien, si ambas poblaciones tienen distribuciones cualesquiera con medias 1 y 2, desvia-
ciones típicas 1 y 2 , y las respectivas muestras son de tamaños n1 y n2 mayor que
30, entonces la distribución muestral de diferencias de medias sigue una distribución nor-

 12  22
mal N( 1 - 2 ;  ), y la variable tipificada viene dada por la expresión
n1 n2

Z=
x 1  x2   ( 1  2 )
 x1  x 2

Nota.- Si 1 y 2 no son conocidas, se aproximan estas por las desviaciones típicas de


sendas muestras siempre que el tamaño de ambas sea superior a 100.
 Los tubos de imagen de televisión fabricados por la empresa A tienen una duración
media de vida de 2500 horas, con una desviación típica de 500 horas, mientras que los
fabricados por la empresa B tienen una duración media de vida de 2300 horas con una
desviación típica de 800 horas. Se toman 300 tubos de imagen de la empresa A y 200 de
la empresa B. Calcula la probabilidad de que la duración media de vida de la muestra de
A no sea superior en más de 100 horas a la duración media de vida de la muestra de B.
sol
La distribución muestral de medias de las poblaciones A y B, X A y X B está caracterizada

Muestreo. Inferencia. Intervalos de Confianza    8 
Germán Jesús Rubio Luna  Catedrático de Matemáticas  del IES Francisco Ayala 

500 800
por  X A = 2500;  X B = 2500;  X A = ; XA = .
300 200

La distribución muestral de diferencia de medias, X A - X B ; admite como media y desvia-


ción típica:
(500) 2 (800) 2
 X A  X B =  X A -  X B = 2500 – 2300 = 200 y  x1  x 2
=  = 63’5
300 200

La probabilidad de que X A - X B  100 es:


100  200
P( X A - X B  100 ) = p ( Z  ) = P(Z  -1,’57) = 0,0582
63,5

Inferencia

Introducción

Nota.- La inferencia estadística trata de obtener conclusiones sobre la población a partir


de la información proporcionada por una muestra aleatoria; es decir, obtener de las pro-
piedades de las muestras una aproximación fiable a las del colectivo o población en estu-
dio.

Nota.- Las inferencias sobre el valor de un parámetro poblacional, como es la media , la


proporción p ó la diferencia de medias, se pueden hacer mediante estimaciones (puntua-
les o por intervalos de confianza) y mediante contrastes de hipótesis (lo veremos en
otra lección).

Def.- Un parámetro es un valor numérico que describe una característica de la población


(, p, 2 , etc.)

Def.- Un estadístico es toda función de los datos muestrales, que asigna a cada muestra
de tamaño n elegida de la población (por muestreo aleatorio simple), un valor numérico.
Tenemos una variable aleatoria que tendrá una distribución de probabilidad llamada Dis-
tribución en el muestreo del estadístico.

Def.- Un estimador para un parámetro poblacional desconocido es un estadístico que


nos da un valor que pertenece al conjunto de valores que puede tomar el parámetro que
se estima. Los que usaremos son:

- Para la media poblacional  utilizaremos el estimador MEDIA MUESTRAL X , que sa-



bemos sigue una N( , ), es decir:
n

X  N( ,
)
n
(Se considerarán las muestras de tamaño n ≥ 30 para poder aplicar el Teorema Central
del Límite y asegurar la distribución anterior).
- Para la proporción muestral p utilizaremos el estimador PROPORCIÓN MUESTRAL P,
pq
que sabemos sigue una N(p, ), es decir:
n

Muestreo. Inferencia. Intervalos de Confianza    9 
Germán Jesús Rubio Luna  Catedrático de Matemáticas  del IES Francisco Ayala 

pq
P  N(p, ), donde q = 1- p
n

(Se considerarán las muestras de tamaño n ≥ 30 para poder aplicar el Teorema Central
del Límite y asegurar la distribución anterior).

- Para la diferencia de medias 1 - 2 utilizaremos el estimador DIFERENCIA DE ME-

 12  22
DIAS X2 - X1 , que sabemos sigue una N( 1 - 2 ;  ), es decir:
n1 n2

 12  22
X2 - X1  N( 1 - 2 ;  )
n1 n2

(Se considerarán las muestras de tamaño n ≥ 30 para poder aplicar el Teorema Central

Estimación Puntual

Nota.- Consiste en tomar como valor del parámetro poblacional desconocido (, p...), el
de un estadístico ( x , p̂ , ...), obtenido en una muestra aleatoria elegida de la población ob-
jeto de estudio; es decir, al ofrecido por el estimador sobre una muestra.

Se utilizarán los estimadores definidos en el apartado anterior para hacer estimaciones de


la media y la proporción poblacional.

Estimación por intervalos de confianza

Nota.- Consiste en encontrar un intervalo (a, b) de manera que tengamos una cierta con-
fianza (nivel de confianza 1 - ) de que el parámetro poblacional desconocido , p...), se
encuentre en dicho intervalo.
Se considera que la población de partida sigue una distribución Normal con desviación
típica conocida () para la estimación de , o una distribución Binomial para la estimación
de p.

Pasos para construir el intervalo de confianza

(a) Se elige un estimador del parámetro que se desea estimar ( X para , P̂ para p y
X1 - X2 para 1 - 2).
(b) Se elige un nivel de confianza 1 –  con el que se desea construir el intervalo, eso
quiere decir que, antes de elegir la muestra, se tendrá un probabilidad 1 –  de que el in-
tervalo construido a partir de esa muestra contenga al parámetro de la población.
(c) Se toma una muestra aleatoria de la población de tamaño n y en ella se obtiene el
valor del estadístico correspondiente.
(d) Se construye el intervalo centrado en el estadístico ( x , p̂ , x 2 - x1 ), teniendo en cuenta
que al ser intervalos simétricos, se tiene que cumplir p(|Z| < z1 - /2 ) = 1 - . Desarrollando
esta expresión obtenemos, según la distribución muestral correspondiente, obtendremos
las probabilidades:
   
p  x - z1 -  / 2 .    x  z1 -  / 2 . = 1-
 n n

Muestreo. Inferencia. Intervalos de Confianza    10 
Germán Jesús Rubio Luna  Catedrático de Matemáticas  del IES Francisco Ayala 

 ˆ  p)
p(1 ˆ ˆ 
ˆ  p)
p(1
p  pˆ - z1 / 2 . ,pˆ + z1 / 2 . = 1-
 n n 
  12  22  12  22 
p  (x1 -x 2 ) - z1 / 2 . +  1 - 2 < (x1 -x 2 ) + z1 / 2 . + = 1-
 n1 n2 n1 n2 

con lo cual los respectivos intervalos de confianza serán:


   
I() =  x  z1 / 2  , x  z1 / 2   para estimar 
 n n 
 ˆ  p)
p(1 ˆ ˆ 
ˆ  p)
p(1
I(p) =  pˆ - z1 / 2 . ,pˆ + z1 / 2 .  para estimar p
 n n 
  12  22  12  22 
I(1 – 2) =  (x1 -x 2 ) - z1 / 2 . + , (x1 -x 2 ) + z1 / 2 . +  para estimar 1 – 2
 n1 n2 n1 n2 

Donde z1 - /2 es el punto crítico de la variable aleatoria Normal tipificada Z  N(0,1) tal
que p(-z1-/2 ≤ Z ≤ z1-/2 ) = 1 – , siendo 1 –  el nivel de confianza elegido.

De la igualdad p(-z1-/2 ≤ Z ≤ z1-/2 ) = 1 – , se deduce que p(Z ≤ z1-/2 ) = 1 - /2, que


se mira en la tabla de la distribución Normal, y nos dará el correspondiente valor crítico
z1 - /2 .

Def.- Se llama amplitud del intervalo a la diferencia = Extremo superior - Extremo infe-
rior del intervalo de confianza.

 Se ha extraído una muestra de 145 alumnos de una escuela de artes, a los que se les
ha propuesto un test de habilidad. La media y la desviación típica obtenida de la muestra
son 82 y 14, respectivamente. A partir de estos datos, calcula el intervalo en el cual se
hallará la media de población al nivel de confianza del 95%. Calcula el intervalo de con-
fianza para los mismos datos correspondientes al nivel de confianza del 99%.
Sol
Los valores que proporciona la muestra de tamaño n = 145 son: x = 82 y  = 14. La dis-
tribución muestral de medias sigue una distribución normal N( ,  x ). Como el tamaño

muestral es superior a 100, podemos aproximar la desviación típica de la muestra por la


de la población:
El valor crítico z1-/2, correspondiente al nivel de confianza 1 –  = 95% es z1-/2 = 1’96;
porque p(Z≤ z1-/2) = 1– /2 = 1– 0’05/2 = 0’975, y mirando en la N(0;1) obtenemos z1-α/2=
1’96
   
 x  z1 /2  , x  z1 /2  
 n n
Sustituyendo y operando, se obtiene: (82 – 1’96.1’162; 82 + 1’96.1’162) = (79’72; 84’28).

Muestreo. Inferencia. Intervalos de Confianza    11 
Germán Jesús Rubio Luna  Catedrático de Matemáticas  del IES Francisco Ayala 

Por tanto, el intervalo (79’72; 84’28) contendrá la media  de la población con una proba-
bilidad de 95%.
En el caso del nivel de confianza del 99% se tiene que el valor crítico z1-/2 correspondien-
te a este nivel de confianza es z1-/2 = 2,58; pues de p(Z ≤ z1-/2) = 1– /2 = 1 + 0’01/2 =
=0’995, y mirando en la N(0;1) obtenemos z1-/2 = 2’58
Sustituyendo y operando, se tiene: (82 – 2’58.1’162, 82 + 2’58.1’162) = (79’00, 85’00).
Luego, el intervalo (79’00, 85’00) contendrá a la media de la población con una probabili-
dad del 99%.
Se observa que, al aumentar el nivel de confianza, se amplía el intervalo y tenemos más
seguridad de encontrar la media de la población en el último intervalo calculado.
 Para estimar la proporción de estudiantes de una universidad que está a favor de la
reinserción social del delincuente, se entrevistó aleatoriamente a 500 estudiantes. El 58%
estaba a favor. Calcula el intervalo de confianza, al nivel de confianza del 95%, en el cual
se hallará la población universitaria que se encuentra a favor.
Sol
Como el tamaño muestral es superior a 100, podemos aproximar P y Q de la población
por las proporciones p y q de la muestra.
p = 0,58; q = 0,42; (p) =  [(PQ)/n] =  [(pq)/n] = [(0’58 . 0’42)/500] = 0’02.
Hemos visto en un problema anterior que a un nivel de confianza 1 -  = 95% = 0’95, le
corresponde el valor z1-/2 = 1,96.
 PQ PQ 
El intervalo de confianza para una proporción p es  P  z1 /2  , P  z1 /2   , sus-
 n n 

tituyendo y operando con los datos, se obtiene (0’58 – 1’96.0’02, 0’58 + 1’96.0’02) es decir
el intervalo es (0’5408; 0’6192) al nivel de confianza del 95%
El verdadero porcentaje poblacional P se encontrará en el intervalo (0’5408; 0’6192) con
una probabilidad del 95%.

- El error de la estimación es la diferencia, en valor absoluto, entre el parámetro pobla-


cional y el estadístico muestral, por lo tanto el error máximo de estimación será el radio
del intervalo (lo que sumamos o restamos al punto medio del intervalo):


-Error máximo = E = z1 /2  , para el intervalo de la media (radio del intervalo) y
n

ˆ  p)
p(1 ˆ ˆ ˆ
p.q
-Error máximo = E = z1 /2 . = z1 /2 . , para el intervalo de la proporción (radio
n n

Muestreo. Inferencia. Intervalos de Confianza    12 
Germán Jesús Rubio Luna  Catedrático de Matemáticas  del IES Francisco Ayala 

del intervalo) .
 12  22
-Error máximo = E = z1 / 2 . + , para el intervalo diferencia de medias (radio del inter-
n1 n2
valo) .

b-a
Nota.- A veces si me dan el intervalo (a,b) tenemos en cuenta que el error es E = ,y
2
a+b
que el punto medio del intervalos , será x , p̂ ó ( x1 - x 2 ) , dependiendo del tipo de
2

itervalo.

Muestreo. Inferencia. Intervalos de Confianza    13 

También podría gustarte