1 Prueba de Hipótesis para La Media y Diferencia de Medias
1 Prueba de Hipótesis para La Media y Diferencia de Medias
1 Prueba de Hipótesis para La Media y Diferencia de Medias
grande.
1.- Según experiencias pasadas, se sabe que en una compañía el retardo promedio por mes de
sus obreros es de 64 minutos con una desviación estándar de 8 minutos. El gerente de la
compañía considera que éste promedio ha aumentado sensiblemente en los últimos meses, por
lo cual ordena efectuar la investigación correspondiente. Para tal fin, se toma una muestra
aleatoria de n=64 obreros y se encuentra que la misma presenta una media de X́ = 68 minutos.
Se pide comprobar si el gerente tiene o no la razón con un nivel de significación de 0.05.
Pasos para la prueba de hipótesis
1.- Contraste de hipótesis (plantear la Ho y la H 1)
Ho: µ ≤ 64
H1: µ > 64
2.- Elegir un nivel de significancia: α = 0.05
3.- Elección del estadístico de prueba (estadístico Z o t)
Se conoce la desviación estándar de la población (σ), además que el tamaño de muestra es lo
suficientemente grande
X́−µ
Z= σ
√n
4.- Tipo de prueba de hipótesis (bilateral, unilateral derecha o unilateral izquierda)
El tipo de prueba no lo indica la H1, (H 1: µ > 64) en este caso es unilateral derecha
Gráfica de distribución
Normal, Media=0, Desv.Est.=1
0.4
0.3
Densidad
0.2
0.1
0.05
0.0
0 1.645
X
Gráfica de distribución
Normal, Media=0, Desv.Est.=1
0.4
El valor de Z
calculado es igual
a 4, cae en la
0.3
región de rechazo
de Ho
Densidad
0.2
0.1
0.05
0.0
0 1.645
X
7.- Conclusión
Con un 95% de confianza se puede concluir que el retardo promedio de los obreros de la
compañía es mayor a 64 minutos.
Gráfica de distribución
T, df=19
0.4
0.3
Densidad
0.2
0.1
0.05
0.0
-1.729 0
X
Ejemplo
Un equipo de investigadores desea saber si los datos que han recolectado proporcionan la
evidencia suficiente para indicar una diferencia entre las concentraciones medias de ácido úrico
en el suero de individuos normales e individuos con síndrome de Down. Los datos consisten en
las lecturas de ácido úrico en el suero de 12 individuos con síndrome de Down y 15 individuos
sanos. Las medias son X́ 1 = 4.5 mg /100 ml y X́ 2 =3.4 mg/100ml.
Los datos corresponden a dos muestras aleatorias simples e independientes, cada una extraída
de una población que sigue una distribución normal, con una varianza (σ 12) igual a 1 para la
Se podrá decir que los datos ofrecen evidencia de que las medias poblacionales son diferentes.
Z = ( X́ − X́ )−¿ ¿1 2
Gráfica de distribución
Normal, Media=0, Desv.Est.=1
0.4
0.3
Densidad
0.2
0.1
0.025 0.025
0.0
-1.960 0 1.960
X
√ +
12 15
Ejemplo
Un estudio de los investigadores Eidelman et al. tiene como objetivo examinar las características
de destrucción pulmonar en personas que fuman cigarros antes de desarrollar un marcado
enfisema pulmonar. Se practicaron mediciones de tres índices de destrucción pulmonar en los
pulmones de personas longevas que no fumaban y en personas con tabaquismo que murieron
repentinamente fuera del hospital por causas no respiratorias. Una calificación alta indica un
mayor daño pulmonar. En la tabla se muestran las calificaciones producidas para uno de los
índices de destrucción pulmonar de una muestra de nueve personas que no fuman y 16
fumadores. Se pretende saber si es posible concluir, con base en los datos, que las personas que
sí fuman, en general, tienen los pulmones más dañados que las personas no fumadoras, como lo
indican las mediciones.
Los datos corresponden a dos muestras aleatorias simples e independientes; una muestra
corresponde a la población de personas que no fuman (NF), y la otra a la población de fumadores
(F). Las calificaciones para los índices de destrucción pulmonar en ambas poblaciones siguen
una distribución aproximadamente normal. No se conocen las varianzas poblacionales, pero se
supone que son iguales.
t =( X́ ¿ ¿1− X́ )−¿ ¿ ¿
2
(n¿¿ 2−1) s 22
sp 2
= (n¿ ¿1−1) s 21 +
n1 +n 2−2
¿¿
ν = n1 + n2 – 2 (grados de libertad)
4.- Tipo de prueba de hipótesis (bilateral, unilateral derecha o unilateral izquierda)
El tipo de prueba no lo indica la H1, (H 1: µF > µNF) en este caso es unilateral derecha. Como
estamos usando el estadístico t, usamos un α = 0.05 y con n1 + n2 -2 grados de libertad; en este
ejemplo sería, 16 + 9 – 2 = 23
Gráfica de distribución
T, df=23
0.4
0.3
Densidad
0.2
0.1
0.05
0.0
0 1.714
X
(n¿¿ 2−1)s 22
sp = √ (n ¿¿1−1) s21 +
n 1+ n2−2
¿¿
( 17.538−12.433 )−0
t =( X́ − X́ )−¿ ¿ = 1 1 2.66
1 2
4.6088
√ +
16 9
Ejemplo
Un grupo de investigadores quiere saber si las poblaciones difieren con respecto al valor medio
de la actividad del complemento del suero total (C H50). Los datos se componen de las mediciones
de CH50 en n1 = 10 individuos aparentemente sanos y n 2 = 20 individuos enfermos. Las medias de
las muestras y desviaciones estándar son:
X́ 1 = 62.6, S1 = 33.8
X́ 2 = 47.2, S2 = 10.1
Los datos corresponden a dos muestras aleatorias independientes; una extraída de una población
de sujetos aparentemente normales, y la otra seleccionada de una población de individuos
enfermos. Se supone que los valores de C H50 siguen una distribución aproximadamente normal en
ambas poblaciones. Las varianzas de las poblaciones se desconocen y son diferentes.
t = ( X́ − X́ )−¿ ¿
1 2
2
s 21 s22
( +
n 1 n2 )
ν= s21
2
s 22
2
Redondeo hacía abajo al entero más cercano
( ) ( )
n1
+
n2
n 1−1 n2−1
0.3
Densidad
0.2
0.1
0.025 0.025
0.0
-2.262 0 2.262
X
( 62.6−47.2 )−0
t = ( X́ − X́ )−¿ ¿ = 33.8 2 10.12 = 1.41
1 2
√ 10
+
20
7.- Conclusión
Con base en estos resultados, no se puede concluir que las dos medias de las poblaciones son
diferentes a un nivel de significancia α = 0.05