4f Inferencia Estadistica

PRUEBAS DE HI PTESI S DE DOS MUESTRAS
4f. Pruebas de hiptesis

Introduccin
Hasta ahora se vieron pruebas de hiptesis para
inferir caractersticas (media, varianza o proporcin)
de la POBLACIN por medio de UNA MUESTRA.

Se seleccion una sola muestra aleatoria de una
poblacin y se realiz una prueba para ver si era
razonable/correcto el valor propuesto de la
poblacin.
Ahora se ampliar el estudio a casos de pruebas de
hiptesis para dos muestras, donde se seleccionan
muestras aleatorias de dos poblaciones distintas para
determinar si son iguales las medias o las proporciones
de la poblacin.
Casos que veremos:
Hay alguna diferencia en el nmero medio de defectos
producidos en los turnos matutino y vespertino de GM?
Hay un aumento en la tasa de produccin si se toma
msica en el rea de produccin?
Hay alguna diferencia en la proporcin de estudiantes de
MBA y de maestra en ingeniera que aprobaron el examen
de certificacin en el primer intento?
Pruebas de hiptesis para dos muestras: Muestras
independientes
Si partimos del caso:
Suponer que un analista financiero busca saber si la tasa de
recuperacin media para los fondos mutualistas de alto
rendimiento ES DISTINTA a la tasa de recuperacin media
para los fondos mutualistas globales.

En este caso hay 2 poblaciones independientes:
1. Fondos mutualistas de alto rendimiento
2. Fondos mutualistas globales

Entonces, se deben seleccionar una muestra aleatoria de
CADA POBLACIN, y se calculara la media de las 2
muestras.
Si las dos media muestrales son iguales, es esperara que
la diferencia entre las dos medias poblacionales fuera
ceroPero qu pasara si los resultados, dado que son
muestrales, produjeran una diferencia distinta de cero?
la diferencia se debe a la casualidad o realmente existe
una diferencia entre ambos fondos?
Por medio de una prueba de hiptesis para ambas
medias muestrales ayudar a contestar esta pregunta.

Recordando que una distribucin de medias
suele aproximarse a la distribucin normal,
entonces se supondr que una distribucin
de las medias de muestras seguir una
distribucin normal, y con esto asumimos
que la distribucin de sus diferencias
tambin seguir una distribucin normal.
Sobre la variabilidad de la distribucin de las
diferencias de medias muestrales, si ambas
provienen de poblaciones independientes, la
distribucin de las diferencias tienen una varianza
igual a la suma de dos varianzas individuales, es
decir:
Varianza de la distribucin de las diferencias en medias
Para considerar esto como error estndar, se saca
raz y para considerar el estadstico de prueba
estandarizado resulta:
Los clientes de Soriana tienen una opcin de pagar por
sus compras. Pueden pagar en caja registradora normal
operada por una cajero o bien por internet.
Se seleccionan 2 muestras resultando: el ticket promedio
de 50 clientes que compran fsicamente en tienda es de
$1,500 con una desviacin estndar de la poblacin de
$300 mientras que el ticket promedio de 100 clientes de
compras en lnea es de $1,750 con una desviacin
estndar de la poblacin de $150.
Podra afirmarse con un nivel de confianza de 95% que
los clientes de Soriana en general (incluyendo los que van
fsicamente a las tiendas como los compradores en lnea)
en promedio compran cantidades similares?
Se establece hiptesis nula y alternativa:
Ho :
s
=
u
Ha :
s

u

Dado el nivel de significancia de 0.05 se establecen
las regiones crticas:

Estadstico de prueba:
1- = 0.95
= 0.05
/2= 0.025
-1.96
1.96
Se rechaza Ho
Por lo que se concluye que
existe una diferencia en el ticket
promedio entre ambos tipos de
clientes
Considera una muestra de 40 observaciones de una poblacin con una desviacin
estndar de la poblacin de 5. La media muestral es 102. Otra muestra de 50
observaciones de una segunda poblacin tiene una desviacin estndar de la
poblacin de 6. La media muestral es de 99. Realice una prueba de hiptesis con un
nivel de significancia de 0.04.
Un analista financiero quiere comparar las tasas de recuperacin, en porcentaje,
para acciones relacionadas con el petrleo con otro tipo de acciones, como las de
GE o IBM. Selecciona 32 acciones relacionadas con el petrleo y 49 de otro tipo. La
tasa de recuperacin de acciones relacionadas con petrleo es de 31.4% y la
desviacin estndar de la poblacin de 5.1%. Para las dems acciones, la tasa media
se calcul en 34.9% y una desviacin estndar de la poblacin de 6.7%. Hay alguna
diferencia relevante en las tasas de recuperacin de los dos tipos de acciones?
Utilizar un nivel de significancia de 0.01.
La compaa NESTLE en su rea Gerber desea comparar el aumento de peso en
bebs que consumen su producto en comparacin con el producto de su
competidor. Una muestra de 40 bebs que consumen los productos Gerber revel
un aumento de medio medio de 7.6 libras en los primeros 3 meses. Para la marca
Gerber, la desviacin estndar de la poblacin es de 2.3. Una muestra de 55 bebs
que consumen la marca de su competidor revel un aumento medio de 8.1 libras.
La desviacin estndar de la poblacin es de 2.9 libras. Con un nivel de
significancia de 0.05. es posible concluir que los bebs que consumieron Gerber
ganaron menos peso?
Prueba de proporciones de dos muestras
Para casos donde se requiere saber si dos
proporciones de muestras provenientes de
poblaciones iguales.
Ejemplos de casos:
El VP de RH desea saber si hay alguna diferencia en la
proporcin de empleados asalariados por hora que faltan ms
de 5 das de trabajo por ao en las plantas de Atlanta y
Houston.
Ford considera un diseo nuevo para su modelo Focus. El
diseo se muestra a un grupo de compradores potenciales
menores de 30 aos de edad y otro grupo de compradores de
mayores de 60 aos de edad. La compaa quiere saber si hay
alguna diferencia en la proporcin de los dos grupos que les
gusta el diseo nuevo.
En estos casos, cada elemento o individuo
muestreado se clasifica como xito o fracaso. Es
decir, en el ejemplo de Ford, cada comprador
potencial se clasifica como le gusta el diseo nuevo
o NO le gusta el diseo nuevo.
Despusse compara la proporcin en el grupo d
menores de 30 aos con la proporcin en el grupo de
mayores de 60 aos que indique el gusto por el
diseo nuevoLas diferencias se deben a la
casualidad?
Para hacer la prueba de hiptesis se asume que la
muestra es lo bastante grande para que la
distribucin normal sirva como una buena
aproximacin a la distribucin binomial.

n
1
nmero de observaciones en la 1 muestra
n
2
nmero de observaciones en la 2 muestra
P
1
proporcin de 1 muestra que posee la caracterstica
P
2
proporcin de la 2 muestra que posee la caracterstica
P
c
proporcin conjunta que posee la caracterstica en las
muestras combinadas, y se calcula:
X1 nmero que posee la
caracterstica en la 1 muestra
X2 nmero que posee la
caracterstica en la 2 muestra

Ejemplo
La compaa de perfumes Manelli desarroll una fragancia
nueva. Varios estudios de mercado indican que esta nueva
fragancia tiene un buen potencial. El depto. De ventas tiene
inters en saber si hay alguna diferencia en las proporciones
de mujeres jvenes y mayores que compraran el perfume si
saliera al mercado. Hay dos poblaciones independientes: una
de mujeres jvenes y otra de mujeres mayores. A cada una de
las mujeres muestreadas se le pedir que huela la fragancia
nueva e indique si le gusta lo suficiente para comprar el
perfume.
Realizar la prueba de hiptesis a un nivel de significancia de
0.05 cuando los resultados fueron:
Una muestra aleatoria de 100 mujeres jvenes revel que a 19 les gust
la nueva fragancia lo suficiente para comprar el perfume.P1
Una muestra de 200 mujeres mayores revelo que a 62 les gust la nueva
fragancia lo suficiente para comprarlaP2
Solucin al ejemplo
1. Formular hiptesis nula/alternativa:
Ho : 1 = 2 Ha: 1 2
2. Regiones crticas:

3. Proporciones:

1- = 0.95
= 0.05
/2= 0.025

-1.96 1.96
-1.96 1.96
-2.21
Se rechaza Ho.
Se rechaza la hiptesis nula de
que la proporcin de mujeres
jvenes que compraran la
fragancia es igual a la
proporcin de mujeres mayores
que tambin la compraran.
Ejercicios en clase
La hiptesis nula y alternativa son:
Ho:1 < 2 Ha: 1 > 2
Una muestra de 200 observaciones de la 1 poblacin indic que X1 es 170;
otra de 150 observaciones de la 2 poblacin revel que X2 es 110. Utilice un
nivel de significancia de 0.05 para probar la hiptesis.

La familia Damon posee un viedo grande en el oeste de NY. Probaran 2
nuevos insecticidas (Pernod 5 y Action). Para probarlos, se seleccionaron 3
hileras y se fumigaron con Pernod 5, y otras 3 con Action. Tiempo despus,
se revisaron 400 vides tratadas con Pernod 5 e igualmente otras 350 se
revisaron para verificar el efecto de Action. Los resultados fueron:

Con un nivel de significancia de 0.05 se puede concluir que existe una
diferencia en la proporcin de vides infectadas empleando Pernod 5 en
comparacin con las fumigadas con Action?

Comparacin de medias con desviaciones estndares
de la poblacin desconocidas (prueba t conjunta)
En los casos hasta ahora vistos se utiliz la z
(distribucin normal estndar) como estadstico de
prueba.
Se compararon medias muestrales de 2 poblaciones
independientes con el objetivo de saber si provenan de
las mismas poblaciones o de poblaciones iguales
(medias poblacionales estadsticamente iguales).
La realidad es que difcilmente conoceremos la
desviacin estndar poblacional () por lo que
utilizaremos la desviacin estndar de la muestra (s).
En este mtodo compararemos medias muestrales de
2 poblaciones independientes con el objetivo de
saber si estadsticamente son iguales (misma media).
Pero hay 2 diferencias respecto al mtodo descrito
con anterioridad:
Las poblaciones muestreadas tienen desviaciones estndares
iguales pero desconocidas. Debido a esta suposicin, las
desviaciones estndares de las muestras se combinan o
agrupan.
Se utiliza la distribucin t como el estadstico de prueba.
De qu manera se agrupan las desviaciones
estndar muestrales?
Las 2 desviaciones estndares de las muestras se agrupan para
formar una sola estimacin de la desviacin estndar
desconocida de la poblacin.
Esto se calcula mediante una media ponderada de las dos
desviaciones estndares de las 2 muestras.
Las ponderaciones son los grados de libertad de cada muestra.
El estadstico de prueba t se calcula:
Ejemplo
Owens Inc. Analiza dos procedimientos distintos
para el montaje del motor al chasis de una podadora.
La pregunta es: existe una diferencia en el tiempo
medio para montar los motores al chasis?.
El primer procedimiento se consultaron 5
mediciones y result un tiempo promedio de 4 min
con una desviacin estndar muestral de 2.91.
El segundo procedimiento se consultaron 6
mediciones y result un tiempo promedio de 5 min
con una desviacin estndar muestral de 2.09.
Utilice un nivel de significancia de 0.1
La hiptesis nula establece que NO hay diferencia en
los tiempos promedio de montaje, por lo que la
alternativa indicar que SI existe una diferencia:
H0:
1
=
2
Ha:
1

2

Las regiones crticas son:
Se considera la suma de
n1 + n2 menos 2 g.l. al
ser 2 muestras.
Entonces sera 5+6-2 =9
Buscando en tablas de t
student:
t
9,0.1
-1.83 +1.83
Rechazo Ho Rechazo Ho
Agrupando las varianzas de las muestras:

Determinando valor del estadstico de prueba t:
-1.83 +1.83
-0.662
Por lo que NO se rechaza Ho, se acepta Ho como cierta.
Se concluye que NO existe diferencia en los tiempos
medios para montar el motor en el chasis con los 2
mtodos.
Ejercicios en clase
La hiptesis nula y alternativa son:
H0:
1
=
2
Ha:
1

2

Una muestra aleatoria de 10 observaciones de una poblacin revel una media
muestral de 23 y una desviacin estndar de 4. Una muestra aleatoria de 8
observaciones de otra poblacin revel una media muestral de 26 y una
desviacin estndar de la muestra de 5. Con un nivel de significancia de 0.05.
hay alguna diferencia entre las medias poblacionales?

En un estudio reciente se compar el tiempo que pasan juntas las parejas en
que slo trabaja uno de los cnyuges con las parejas en que ambos trabajan.
De acuerdo con los registros llevados por las esposas durante el estudio, la
cantidad media de tiempo que pasan juntos viendo tv entre las parejas que
slo trabaja uno de los cnyuges fue de 61 min con una desviacin estndar de
15.5 min. Para las parejas en que los dos trabajan el nmero promedio de
minutos viendo tv fue de 48.8 min con una desviacin estndar de 18.1 min.
Con un nivel de significancia de 0.01 se puede concluir que en promedio las
parejas en que slo trabaja uno de los cnyuges pasa ms tiempo juntos
viendo tv?
En el estudio se consideraron 15 parejas en que slo trabajaba uno y 12 que
ambos trabajaban.
Comparacin de medias poblacionales con
desviaciones estndares desiguales
Hasta ahora se vieron los casos donde suponemos
que las poblaciones tenan desviaciones estndares
IGUALES.
Importante: NO se conocan los valores pero
SUPONAMOS eran iguales.
Qu pasa si las desviaciones estndar de la poblacin
suponemos son DIFERENTES?
Se emplearn nuevamente las desviaciones estndar
de las muestras (S1 y S2) en lugar de las de la
poblacin.
Estadstico de prueba para medias sin diferencia,
varianzas desiguales:

Grados de libertad para prueba con varianza
desigual:
Ejemplo
Se desea conocer la absorcin de toallas de papel. Se
comparan toallas de marcas diferentes de calidad similar.
Una primera muestra de la marca 1 se realiz el
experimento con 9 toallas obtenindose una absorcin
media de 6.44ml con una desviacin estndar de 3.32ml.
La segunda muestra de la marca 2 se realiz con 12
toallas obtenindose una absorcin media de 9.417ml
con una desviacin estndar de 1.621ml.
Utilice un nivel de significancia de 0.1 y pruebe que
existe una diferencia en la cantidad media de lquido
absorbido.
Las cantidades de lquido absorbido siguen una
distribucin Normal. No se conocen las desviaciones
estndar de la poblacin por lo que se utilizar la
distribucin t.
Se consideran la hiptesis nula y alternativa:
H0: 1=2 Vs Ha: 12
Se ajustan los grados de
libertad dado que
suponemos
desviaciones estandares
de la poblacin
DESIGUAL
Se calcula el estadstico de prueba:

Buscando en tablas de la Distribucin t-student con
nivel de significancia de 0.1 y 10 grados de libertad,
consideramos las regiones crticas
-1.812
+1.812
-2.418
Por lo que se
RECHAZA H0, se
concluye que la tasa
de absorcin media
para las 2 marcas
de toallas NO es la
mis.a
Prueba de hiptesis de dos muestras:
Muestras dependientes
Este mtodo se utiliza cuando las muestras son
dependientes o estn relacionadas.
Tambin se les conoce como muestras
apareadas.
Bsicamente lo que vamos a utilizar como muestra
ser la distribucin de las medias de las diferencias
de ambas muestras.
Vamos a explicar esto ltimo por medio de un
ejemplo:

Un ejecutivo de crditos hipotecarios de Bancomer
recurre a dos empresas dedicadas a Bienes Raices:
Century 21 y Kasa; para valuar propiedades que estn
susceptibles de venta. Es importante que ambas
empresas tengan valores similares en sus avalos. Para
realizar esto, Bancomer selecciona 10 casas de forma
aleatoria y pide a Century 21 y Kasa realicen su avalos.
Entonces, para cada casa, se realizarn 2 avalos, uno
realizado por Century 21 y otro por Kasa.
Los avalos dependen o estn relacionados con la casa
seleccionada.
Para la prueba de hiptesis el inters es la distribucin
de las diferencias en el valor del avalo de cada casa.
Entonces de aqu solo hay 1 muestra.
Bancomer intenta saber si la media de la distribucin
de las diferencias en los avalos es cero, es decir, sin
diferencia o si existe alguna diferencia.
La muestra se compone de las diferencias de los
avalos de ambas empresas (Century 21 y Kasa).
Si ambas empresas reportan estimados similares,
entonces algunas veces los avalos de Century 21 sern
mayores y otras veces sern los de Kasa. A pesar de
esto la media de las diferencias ser cero.
Se utilizar
d
para indicar la media poblacional de
la distribucin de las diferencias, suponiendo que la
distribucin de las diferencias sigue una distribucin
Normal.
El estadstico de prueba sigue la distribucin t
student (con n-1 grados de libertad) y se
calcula:

d : es la media de las diferencias entre las
observaciones apareadas o relacionadas.
S
d
: desviacin estndar de las diferencias entre las
observaciones apareadas o relacionadas.
n : nmero de observaciones apareadas.
S
d
se calcula de manera similar al clculo normal de
la desviacin estndar, nicamente cambiando x por
d, es decir:
Ejemplo
Del ejemplo de los avalos a 10 casas, si tuviramos los
resultados siguientes:

Con un nivel de significancia de 0.05 se puede concluir
que hay una diferencia en los avalos medios de las
casas?

1. Formular hiptesis nula y alternativa:
Ho:
d
= 0 Vs Ha:
d
0
2. Hay 10 casas valuadas por ambas empresas, entonces n=10 y
gl= 10-1=9. Se tiene una prueba de dos colas a un nivel de
significancia de 0.05 (=0.05). Buscando en tablas t student
para determinar valores crticos:

-2.262
+2.262
Calculando el estadstico de prueba:
-2.262
+2.262
3.305
Se rechaza Ho,
concluyndose que la
distribucin de las
diferencias de la poblacin
NO tiene una media de 0,
hay una diferencia en los
avalos medios de las
casas.

4f Inferencia Estadistica

Cargado por

Copyright:

Formatos disponibles

4f Inferencia Estadistica

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

4f Inferencia Estadistica

Cargado por

Copyright:

Formatos disponibles

PRUEBAS DE HI PTESI S DE DOS MUESTRAS

4f. Pruebas de hiptesis

También podría gustarte