3.6 Prueba de Hipótesis para La Media 3.7 Prueba de Hipótesis para La Diferencia de Medias

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 11

3.

6 Prueba de hipótesis para la media (desviación estándar conocida)


En esta sección consideramos de manera formal pruebas de hipótesis en una sola media poblacional. El
modelo para la situación subyacente se centra alrededor de un experimento con X1, X2, . . . , Xn, que
representan una muestra aleatoria de una distribución con media μ y varianza σ2 > 0. Considere primero la
hipótesis
H0: μ = μ0,
H1: μ =/ μ0.
El estadístico de prueba adecuado se debería basar en la variable aleatoria X ¯. En
La unidad anterior se presentó el teorema del límite central, el cual establece en esencia que sin importar la
distribución de X, la variable aleatoria X ¯ tiene una distribución aproximadamente normal con media μ y
varianza σ2/n para tamaños de muestras razonablemente grandes. De esta manera, Podemos determinar,
entonces, una región crítica basada en el promedio muestral calculado, x¯.
Ejemplo.
Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado mostró una vida promedio
de 71.8 años. Suponiendo una desviación estándar poblacional de 8.9 años, ¿esto parece indicar que la vida
media actual es mayor que 70 años? Utilice un nivel de significancia de 0.05.
DATOS.
n= 100
 = 71.8
= 8.9
α= 0.05

PASO 1. Formulemos las hipótesis recordando que con frecuencia usamos el signo de igualdad en la hipótesis
nula y de acuerdo con lo mencionado en el problema “que la vida media actual es mayor que 70 años”
usaremos el signo “mayor que” para la hipótesis alternativa.

H0: μ = 70 años.
H1: μ > 70 años.

PASO 2. Sustituir en la fórmula de Z.

71.8−70 1.8
z= = = 2.0224
8.9/ √ 100 0.89

PASO 3. Encontrar la región critica o de rechazo para un nivel de significancia α= 0.05. Para esto debemos de
saber que el valor del área bajo la curva 0.05 (por el valor de α) se encuentra al lado derecho del valor Z pero
el valor que debemos encontrar para usar la tabla es el de 1- α por lo tanto para encontrar el valor critico
debemos buscar en la tabla de distribución normal 1- 0.05 = 0.95, como no encontramos en valor exacto
usaremos 0.9495 que le corresponde el valor Z de 1.64.
PASO 4. Conclusiones.

Valor z=1.64 (nos marca


la línea límite de la Valor z=2.0224
región de rechazo) encontrado por
la formula.

Como se puede ver en la ilustración anterior el valor z encontrado por la formula se encuentra dentro la región
de rechazo (en color amarillo) por lo que vamos a rechazar la hipótesis nula H 0 por lo tanto vamos a dar como
“aceptada” la hipótesis alternativa que nos dice que el promedio de vida es mayor a 70. Por lo que nuestra
conclusión sería: que la vida promedio actual es mayor a 70 años.

Ejemplo 2
Un fabricante de equipo deportivo desarrolló un nuevo sedal para pesca sintético que afirma que tiene una
resistencia media a la rotura de 8 kilogramos con una desviación estándar de 0.5 kilogramos. Pruebe la
hipótesis de que μ = 8 kilogramos contra la alternativa de que μ ≠ 8 kilogramos, si se prueba una muestra
aleatoria de 50 sedales y se encuentra que tiene una resistencia media a la rotura de 7.8 kilogramos. Utilice un
nivel de significancia de 0.01.

DATOS.
=0.5
n=50
=7.8
α= 0.01

PASO 1. Formulemos las hipótesis de acuerdo a lo que nos menciona el ejemplo que nos dice “pruebe la
hipótesis de que μ = 8 kilogramos contra la alternativa de que μ ≠ 8 kilogramos” por lo tanto las hipótesis
quedan de la siguiente manera:
H0: μ = 8 kilogramos.
H1: μ ≠ 8 kilogramos.

PASO 2. Sustituir en la fórmula de Z.

7.8−8 −0.2
z= = = -2.8288
0.5/ √ 50 0.0707

PASO 3. Encontrar la región critica o de rechazo para un nivel de significancia α= 0.01. Para esto recordemos
que por el signo de la hipótesis alternativa ≠, sabemos que es una prueba de dos colas, por lo tanto, para
encontrar el valor de Z debemos de dividir el valor de α entre 2, α /2 que en nuestro caso es de 0.01 / 2 =
0.005 y restar a 1 el valor de α /2, es decir 1- α /2= 1-0.005 =0.995. El valor de 0.995 es el valor que vamos a
buscar en las tablas y nos da un valor de z= 2.57. Aprovechando la simetría de la curva normal tenemos que
las regiones de rechazo se encontrarán en 2.57 y -2.57
PASO 4. Conclusiones.

Valor z= -2.57 de tablas


Valor z= 2.57 de tablas
Valor z= -2.8288
encontrado por
la formula.

Como el valor de z calculado cae en una de las regiones de rechazo, la hipótesis nula se rechaza por lo tanto la
conclusión es que la resistencia media a la rotura no es igual a 8 kg.
Prueba de hipótesis para la media (desviación estándar poblacional
desconocida)
Ciertamente sospecharíamos que las pruebas sobre una media poblacional μ con σ2 desconocida, como la
estimación del intervalo de confianza, debería incluir el uso de la distribución t de Student. Estrictamente
hablando, la aplicación de la t de Student tanto para los intervalos de confianza como para la prueba de
hipótesis se desarrolla con las siguientes suposiciones. Las variables aleatorias X1, X2, . . . , Xn representan una
muestra aleatoria de una distribución normal con μ y σ2 desconocidas.
Entonces, la variable aleatoria tiene una distribución t de Student con n − 1 grados de libertad. La estructura
de la prueba es idéntica a la del caso con σ conocida, con la excepción de que el valor σ en el estadístico de
prueba se reemplaza con la estimación de S calculada, y la distribución normal estándar se reemplaza con una
distribución t. Como resultado, para la hipótesis bilateral

H0: μ = μ0,
H1: μ ≠ μ0,
el rechazo de H0 en un nivel de significancia α resulta cuando un estadístico t calculado

excede tα/2,n−1 o es menor que −tα/2,n−1. El lector debería recordar que la distribución t es simétrica alrededor
del valor cero. Así, esta región crítica de dos colas se aplica de forma similar a la del caso de σ conocida.
Para la hipótesis bilateral en un nivel de significancia α, se aplican las regiones críticas de dos colas. Para H1:
μ > μ0, el rechazo resulta cuando t > tα,n−1. Para H1: μ < μ0, la región crítica está dada por t > −tα,n−1.

Ejemplo:
El Instituto Eléctrico Edison publica cifras del número anual de kilowatts-hora que gastan varios aparatos
electrodomésticos. Se afirma que la aspiradora gasta un promedio de 46 kilowatts-hora al año. Si una muestra
aleatoria de 12 hogares que se incluye en un estudio planeado indica que las aspiradoras gastan un promedio
de 42 kilowatts-hora al año con una desviación estándar de 11.9 kilowatts-hora, ¿en un nivel de significancia
de 0.05 esto sugiere que las aspiradoras gastan, en promedio, menos de 46 kilowatts-hora anualmente?
Suponga que la población de kilowatts-hora es normal.

DATOS.
n=12
 = 42 kw
S=11.9
α=0.05

PASO 1 Formular la hipótesis. Recordemos que frecuentemente se asigna el signo de igualdad a la hipótesis
nula. Para planear la hipótesis alterna no auxiliamos del enunciado del ejemplo que nos dice “esto sugiere que
las aspiradoras gastan, en promedio, menos de 46 kilowatts-hora anualmente” por lo que quedaría de la
manera siguiente:

H0: μ = 46 kilowatts-hora.
H1: μ < 46 kilowatts-hora.

PASO 2. Sustituir en la fórmula de t.


42−46 −4
t= = = -1.1644
11.9/ √12 3.4352
PASO 3. Con el nivel de significancia de α=0.05 encontraremos los valores de t. Para esto, utilizaremos en
valor de α= 0.05 y con grados de libertad v= n-1= 12-1=11, si buscamos este valor en la tabla de distribución t
encontramos que es de 1.796. Dado el signo de la hipótesis alterna sabemos que la región de rechazo se
encuentra en el lado negativo por lo que aprovechando la propiedad de la curva de distribución t que también
es simétrica podemos decir que t= -1.796.

Valor t= -1.796 Valor t= -1.1644

PASO 4. Conclusiones.
Como la t calculada cae dentro de la región de aceptación no rechazamos H 0 , por lo tanto podemos concluir
que las aspiradoras domesticas gastan en promedio 46 kilowatts-hora al año.
3.7 Prueba de hipótesis para la diferencia de medias.
Las pruebas con respecto a dos medias representan un conjunto de herramientas analíticas muy importantes
para el científico o el ingeniero.
El procedimiento experimental es como sigue: se extraen dos muestras aleatorias independientes de tamaño n1
y n2, respectivamente, de dos poblaciones con medias μ1 y μ2, y varianzas σ21 y σ22. Sabemos que la variable
aleatoria tiene una distribución normal estándar. Suponemos aquí que n1 y n2 son suficientemente grandes, por
lo que se aplica el teorema del límite central. Por supuesto, si las dos poblaciones son normales, el estadístico
anterior tiene una distribución normal estándar aun para n1 y n2 pequeñas. Evidentemente, si podemos suponer
que σ1 = σ2 = σ, el estadístico se reduce a

Los dos estadísticos anteriores sirven como base para el desarrollo de los procedimientos de prueba que
incluyen dos medias. La equivalencia con el intervalo de confianza y la facilidad de la transición del caso de
pruebas sobre una sola media hacen que esto sea sencillo.
La hipótesis bilateral sobre dos medias se escribe con bastante generalidad como
H0: μ1 − μ2 = d0.
En efecto, la alternativa puede ser bilateral o unilateral. De nuevo, la distribución que se utiliza es la
distribución del estadístico de prueba bajo H0. Se calculan los valores x ̄1 y x ̄2, y para σ1 y σ2 conocidas, el
estadístico de prueba está dado por

con una región crítica de dos colas en el caso de una alternativa bilateral. Es decir, rechazace H0 a favor de
H1: μ1 − μ2 ≠ d0 si z > zα/2 o z < −zα/2. Las regiones críticas de una cola se utilizan en el caso de alternativas
unilaterales. El lector debería estudiar, como antes, el estadístico de prueba y quedar satisfecho de que para,
digamos, H1: μ1 − μ2 > d0, la señal que favorece H1 provenga de valores grandes de z.
De esta manera se aplica la región crítica de la cola superior.

Varianzas desconocidas pero iguales


Las situaciones que más prevalecen que implican pruebas sobre dos medias son aquellas con varianzas
desconocidas. Si el científico interesado está dispuesto a suponer que ambas distribuciones son normales y
que σ1 = σ2 = σ, se puede utilizar la prueba t combinada (a menudo llamada prueba t de dos muestras). El
estadístico de prueba está dado por el siguiente procedimiento de prueba.

Se incluye la distribución t y no se rechaza la hipótesis bilateral cuando


Del material de la unidad 2 recuerde que los grados de libertad para la distribución t son un resultado de la
combinación de la información de las dos muestras para estimar σ2. Las alternativas unilaterales sugieren
regiones críticas unilaterales, como era de esperarse. Por ejemplo, para H1: μ1 − μ2 > d0, rechace H1: μ1 − μ2
= d0 cuando .

Ejemplo.

Se lleva a cabo un experimento para comparar el desgaste por abrasivos de dos diferentes materiales
laminados. Se prueban 12 piezas del material 1 exponiendo cada pieza a una máquina para medir el desgaste.
Diez piezas del material 2 se prueban de manera similar. En cada caso, se observa la profundidad del
desgaste. Las muestras del material 1 dan un desgaste promedio de 85 unidades con una desviación estándar
muestral de 4; en tanto que las muestras del material 2 dan un promedio de 81 y una desviaci ón estándar
muestral de 5. Podríamos concluir, con un nivel de significancia de 0.05, que el desgaste abrasivo del material
1 excede el del material 2 en más de 2 unidades? Suponga que las poblaciones son aproximadamente
normales con varianzas iguales.

DATOS.

α= 0.05

PASO 1. Formular la hipótesis. Recordemos que generalmente a la hipótesis nula se asigna el signo de
igualdad, en este caso tenemos dos medias y se deben de considerar. La hipótesis alternativa se formula en
base a el enunciado del ejemplo en donde nos dice “que el desgaste abrasivo del material 1 excede el del
material 2 en más de 2 unidades” por lo que quedan de la siguiente manera.

H0: μ1 − μ2 = 2.
H1: μ1 − μ2 > 2.
PASO 2. Sustituya en la formula.

PASO 3. Encontrar t de tablas con un nivel de significancia α=0.05 y con grados de libertad v= n1 + n2 – 2,
que es igual a 12+10 – 2 = 20.
Valor t calculado con
la formula= 1.04 Valor t de tablas= 1.725
PASO 4. Conclusiones.

Como el valor calculado de t cae en la zona de aceptación NO se rechaza H 0 por lo que podemos
concluir que la diferencia entre los materiales 1 y 2 promedio en el desgaste abrasivo es igual a 2.

También podría gustarte