Este documento describe las pruebas de hipótesis para dos muestras. Explica que estas pruebas permiten comparar características como las medias o proporciones de dos poblaciones diferentes mediante el análisis de muestras aleatorias de cada una. Describe tres tipos de pruebas: comparación de medias de muestras independientes, comparación de proporciones de dos muestras, y comparación de medias cuando las desviaciones estándar poblacionales son desconocidas. Incluye fórmulas y ejemplos
0 calificaciones0% encontró este documento útil (0 votos)
2K vistas40 páginas
Este documento describe las pruebas de hipótesis para dos muestras. Explica que estas pruebas permiten comparar características como las medias o proporciones de dos poblaciones diferentes mediante el análisis de muestras aleatorias de cada una. Describe tres tipos de pruebas: comparación de medias de muestras independientes, comparación de proporciones de dos muestras, y comparación de medias cuando las desviaciones estándar poblacionales son desconocidas. Incluye fórmulas y ejemplos
Este documento describe las pruebas de hipótesis para dos muestras. Explica que estas pruebas permiten comparar características como las medias o proporciones de dos poblaciones diferentes mediante el análisis de muestras aleatorias de cada una. Describe tres tipos de pruebas: comparación de medias de muestras independientes, comparación de proporciones de dos muestras, y comparación de medias cuando las desviaciones estándar poblacionales son desconocidas. Incluye fórmulas y ejemplos
Este documento describe las pruebas de hipótesis para dos muestras. Explica que estas pruebas permiten comparar características como las medias o proporciones de dos poblaciones diferentes mediante el análisis de muestras aleatorias de cada una. Describe tres tipos de pruebas: comparación de medias de muestras independientes, comparación de proporciones de dos muestras, y comparación de medias cuando las desviaciones estándar poblacionales son desconocidas. Incluye fórmulas y ejemplos
Descargue como PPTX, PDF, TXT o lea en línea desde Scribd
Descargar como pptx, pdf o txt
Está en la página 1de 40
PRUEBAS DE HI PTESI S DE DOS MUESTRAS
4f. Pruebas de hiptesis
Introduccin Hasta ahora se vieron pruebas de hiptesis para inferir caractersticas (media, varianza o proporcin) de la POBLACIN por medio de UNA MUESTRA.
Se seleccion una sola muestra aleatoria de una poblacin y se realiz una prueba para ver si era razonable/correcto el valor propuesto de la poblacin. Ahora se ampliar el estudio a casos de pruebas de hiptesis para dos muestras, donde se seleccionan muestras aleatorias de dos poblaciones distintas para determinar si son iguales las medias o las proporciones de la poblacin. Casos que veremos: Hay alguna diferencia en el nmero medio de defectos producidos en los turnos matutino y vespertino de GM? Hay un aumento en la tasa de produccin si se toma msica en el rea de produccin? Hay alguna diferencia en la proporcin de estudiantes de MBA y de maestra en ingeniera que aprobaron el examen de certificacin en el primer intento? Pruebas de hiptesis para dos muestras: Muestras independientes Si partimos del caso: Suponer que un analista financiero busca saber si la tasa de recuperacin media para los fondos mutualistas de alto rendimiento ES DISTINTA a la tasa de recuperacin media para los fondos mutualistas globales.
En este caso hay 2 poblaciones independientes: 1. Fondos mutualistas de alto rendimiento 2. Fondos mutualistas globales
Entonces, se deben seleccionar una muestra aleatoria de CADA POBLACIN, y se calculara la media de las 2 muestras. Si las dos media muestrales son iguales, es esperara que la diferencia entre las dos medias poblacionales fuera ceroPero qu pasara si los resultados, dado que son muestrales, produjeran una diferencia distinta de cero? la diferencia se debe a la casualidad o realmente existe una diferencia entre ambos fondos? Por medio de una prueba de hiptesis para ambas medias muestrales ayudar a contestar esta pregunta.
Recordando que una distribucin de medias suele aproximarse a la distribucin normal, entonces se supondr que una distribucin de las medias de muestras seguir una distribucin normal, y con esto asumimos que la distribucin de sus diferencias tambin seguir una distribucin normal. Sobre la variabilidad de la distribucin de las diferencias de medias muestrales, si ambas provienen de poblaciones independientes, la distribucin de las diferencias tienen una varianza igual a la suma de dos varianzas individuales, es decir: Varianza de la distribucin de las diferencias en medias Para considerar esto como error estndar, se saca raz y para considerar el estadstico de prueba estandarizado resulta: Los clientes de Soriana tienen una opcin de pagar por sus compras. Pueden pagar en caja registradora normal operada por una cajero o bien por internet. Se seleccionan 2 muestras resultando: el ticket promedio de 50 clientes que compran fsicamente en tienda es de $1,500 con una desviacin estndar de la poblacin de $300 mientras que el ticket promedio de 100 clientes de compras en lnea es de $1,750 con una desviacin estndar de la poblacin de $150. Podra afirmarse con un nivel de confianza de 95% que los clientes de Soriana en general (incluyendo los que van fsicamente a las tiendas como los compradores en lnea) en promedio compran cantidades similares? Se establece hiptesis nula y alternativa: Ho : s = u Ha : s
u
Dado el nivel de significancia de 0.05 se establecen las regiones crticas:
Estadstico de prueba: 1- = 0.95 = 0.05 /2= 0.025 -1.96 1.96 Se rechaza Ho Por lo que se concluye que existe una diferencia en el ticket promedio entre ambos tipos de clientes Considera una muestra de 40 observaciones de una poblacin con una desviacin estndar de la poblacin de 5. La media muestral es 102. Otra muestra de 50 observaciones de una segunda poblacin tiene una desviacin estndar de la poblacin de 6. La media muestral es de 99. Realice una prueba de hiptesis con un nivel de significancia de 0.04. Un analista financiero quiere comparar las tasas de recuperacin, en porcentaje, para acciones relacionadas con el petrleo con otro tipo de acciones, como las de GE o IBM. Selecciona 32 acciones relacionadas con el petrleo y 49 de otro tipo. La tasa de recuperacin de acciones relacionadas con petrleo es de 31.4% y la desviacin estndar de la poblacin de 5.1%. Para las dems acciones, la tasa media se calcul en 34.9% y una desviacin estndar de la poblacin de 6.7%. Hay alguna diferencia relevante en las tasas de recuperacin de los dos tipos de acciones? Utilizar un nivel de significancia de 0.01. La compaa NESTLE en su rea Gerber desea comparar el aumento de peso en bebs que consumen su producto en comparacin con el producto de su competidor. Una muestra de 40 bebs que consumen los productos Gerber revel un aumento de medio medio de 7.6 libras en los primeros 3 meses. Para la marca Gerber, la desviacin estndar de la poblacin es de 2.3. Una muestra de 55 bebs que consumen la marca de su competidor revel un aumento medio de 8.1 libras. La desviacin estndar de la poblacin es de 2.9 libras. Con un nivel de significancia de 0.05. es posible concluir que los bebs que consumieron Gerber ganaron menos peso? Prueba de proporciones de dos muestras Para casos donde se requiere saber si dos proporciones de muestras provenientes de poblaciones iguales. Ejemplos de casos: El VP de RH desea saber si hay alguna diferencia en la proporcin de empleados asalariados por hora que faltan ms de 5 das de trabajo por ao en las plantas de Atlanta y Houston. Ford considera un diseo nuevo para su modelo Focus. El diseo se muestra a un grupo de compradores potenciales menores de 30 aos de edad y otro grupo de compradores de mayores de 60 aos de edad. La compaa quiere saber si hay alguna diferencia en la proporcin de los dos grupos que les gusta el diseo nuevo. En estos casos, cada elemento o individuo muestreado se clasifica como xito o fracaso. Es decir, en el ejemplo de Ford, cada comprador potencial se clasifica como le gusta el diseo nuevo o NO le gusta el diseo nuevo. Despusse compara la proporcin en el grupo d menores de 30 aos con la proporcin en el grupo de mayores de 60 aos que indique el gusto por el diseo nuevoLas diferencias se deben a la casualidad? Para hacer la prueba de hiptesis se asume que la muestra es lo bastante grande para que la distribucin normal sirva como una buena aproximacin a la distribucin binomial.
Estadstico de prueba: n 1 nmero de observaciones en la 1 muestra n 2 nmero de observaciones en la 2 muestra P 1 proporcin de 1 muestra que posee la caracterstica P 2 proporcin de la 2 muestra que posee la caracterstica P c proporcin conjunta que posee la caracterstica en las muestras combinadas, y se calcula: X1 nmero que posee la caracterstica en la 1 muestra X2 nmero que posee la caracterstica en la 2 muestra
Ejemplo La compaa de perfumes Manelli desarroll una fragancia nueva. Varios estudios de mercado indican que esta nueva fragancia tiene un buen potencial. El depto. De ventas tiene inters en saber si hay alguna diferencia en las proporciones de mujeres jvenes y mayores que compraran el perfume si saliera al mercado. Hay dos poblaciones independientes: una de mujeres jvenes y otra de mujeres mayores. A cada una de las mujeres muestreadas se le pedir que huela la fragancia nueva e indique si le gusta lo suficiente para comprar el perfume. Realizar la prueba de hiptesis a un nivel de significancia de 0.05 cuando los resultados fueron: Una muestra aleatoria de 100 mujeres jvenes revel que a 19 les gust la nueva fragancia lo suficiente para comprar el perfume.P1 Una muestra de 200 mujeres mayores revelo que a 62 les gust la nueva fragancia lo suficiente para comprarlaP2 Solucin al ejemplo 1. Formular hiptesis nula/alternativa: Ho : 1 = 2 Ha: 1 2 2. Regiones crticas:
3. Proporciones:
1- = 0.95 = 0.05 /2= 0.025
-1.96 1.96 Estadstico de prueba: -1.96 1.96 -2.21 Se rechaza Ho. Se rechaza la hiptesis nula de que la proporcin de mujeres jvenes que compraran la fragancia es igual a la proporcin de mujeres mayores que tambin la compraran. Ejercicios en clase La hiptesis nula y alternativa son: Ho:1 < 2 Ha: 1 > 2 Una muestra de 200 observaciones de la 1 poblacin indic que X1 es 170; otra de 150 observaciones de la 2 poblacin revel que X2 es 110. Utilice un nivel de significancia de 0.05 para probar la hiptesis.
La familia Damon posee un viedo grande en el oeste de NY. Probaran 2 nuevos insecticidas (Pernod 5 y Action). Para probarlos, se seleccionaron 3 hileras y se fumigaron con Pernod 5, y otras 3 con Action. Tiempo despus, se revisaron 400 vides tratadas con Pernod 5 e igualmente otras 350 se revisaron para verificar el efecto de Action. Los resultados fueron:
Con un nivel de significancia de 0.05 se puede concluir que existe una diferencia en la proporcin de vides infectadas empleando Pernod 5 en comparacin con las fumigadas con Action?
Comparacin de medias con desviaciones estndares de la poblacin desconocidas (prueba t conjunta) En los casos hasta ahora vistos se utiliz la z (distribucin normal estndar) como estadstico de prueba. Se compararon medias muestrales de 2 poblaciones independientes con el objetivo de saber si provenan de las mismas poblaciones o de poblaciones iguales (medias poblacionales estadsticamente iguales). La realidad es que difcilmente conoceremos la desviacin estndar poblacional () por lo que utilizaremos la desviacin estndar de la muestra (s). En este mtodo compararemos medias muestrales de 2 poblaciones independientes con el objetivo de saber si estadsticamente son iguales (misma media). Pero hay 2 diferencias respecto al mtodo descrito con anterioridad: Las poblaciones muestreadas tienen desviaciones estndares iguales pero desconocidas. Debido a esta suposicin, las desviaciones estndares de las muestras se combinan o agrupan. Se utiliza la distribucin t como el estadstico de prueba. De qu manera se agrupan las desviaciones estndar muestrales? Las 2 desviaciones estndares de las muestras se agrupan para formar una sola estimacin de la desviacin estndar desconocida de la poblacin. Esto se calcula mediante una media ponderada de las dos desviaciones estndares de las 2 muestras. Las ponderaciones son los grados de libertad de cada muestra. El estadstico de prueba t se calcula: Ejemplo Owens Inc. Analiza dos procedimientos distintos para el montaje del motor al chasis de una podadora. La pregunta es: existe una diferencia en el tiempo medio para montar los motores al chasis?. El primer procedimiento se consultaron 5 mediciones y result un tiempo promedio de 4 min con una desviacin estndar muestral de 2.91. El segundo procedimiento se consultaron 6 mediciones y result un tiempo promedio de 5 min con una desviacin estndar muestral de 2.09. Utilice un nivel de significancia de 0.1 La hiptesis nula establece que NO hay diferencia en los tiempos promedio de montaje, por lo que la alternativa indicar que SI existe una diferencia: H0: 1 = 2 Ha: 1
2
Las regiones crticas son: Se considera la suma de n1 + n2 menos 2 g.l. al ser 2 muestras. Entonces sera 5+6-2 =9 Buscando en tablas de t student: t 9,0.1 -1.83 +1.83 Rechazo Ho Rechazo Ho Agrupando las varianzas de las muestras:
Determinando valor del estadstico de prueba t: -1.83 +1.83 Rechazo Ho Rechazo Ho -0.662 Por lo que NO se rechaza Ho, se acepta Ho como cierta. Se concluye que NO existe diferencia en los tiempos medios para montar el motor en el chasis con los 2 mtodos. Ejercicios en clase La hiptesis nula y alternativa son: H0: 1 = 2 Ha: 1
2
Una muestra aleatoria de 10 observaciones de una poblacin revel una media muestral de 23 y una desviacin estndar de 4. Una muestra aleatoria de 8 observaciones de otra poblacin revel una media muestral de 26 y una desviacin estndar de la muestra de 5. Con un nivel de significancia de 0.05. hay alguna diferencia entre las medias poblacionales?
En un estudio reciente se compar el tiempo que pasan juntas las parejas en que slo trabaja uno de los cnyuges con las parejas en que ambos trabajan. De acuerdo con los registros llevados por las esposas durante el estudio, la cantidad media de tiempo que pasan juntos viendo tv entre las parejas que slo trabaja uno de los cnyuges fue de 61 min con una desviacin estndar de 15.5 min. Para las parejas en que los dos trabajan el nmero promedio de minutos viendo tv fue de 48.8 min con una desviacin estndar de 18.1 min. Con un nivel de significancia de 0.01 se puede concluir que en promedio las parejas en que slo trabaja uno de los cnyuges pasa ms tiempo juntos viendo tv? En el estudio se consideraron 15 parejas en que slo trabajaba uno y 12 que ambos trabajaban. Comparacin de medias poblacionales con desviaciones estndares desiguales Hasta ahora se vieron los casos donde suponemos que las poblaciones tenan desviaciones estndares IGUALES. Importante: NO se conocan los valores pero SUPONAMOS eran iguales. Qu pasa si las desviaciones estndar de la poblacin suponemos son DIFERENTES? Se emplearn nuevamente las desviaciones estndar de las muestras (S1 y S2) en lugar de las de la poblacin. Estadstico de prueba para medias sin diferencia, varianzas desiguales:
Grados de libertad para prueba con varianza desigual: Ejemplo Se desea conocer la absorcin de toallas de papel. Se comparan toallas de marcas diferentes de calidad similar. Una primera muestra de la marca 1 se realiz el experimento con 9 toallas obtenindose una absorcin media de 6.44ml con una desviacin estndar de 3.32ml. La segunda muestra de la marca 2 se realiz con 12 toallas obtenindose una absorcin media de 9.417ml con una desviacin estndar de 1.621ml. Utilice un nivel de significancia de 0.1 y pruebe que existe una diferencia en la cantidad media de lquido absorbido. Las cantidades de lquido absorbido siguen una distribucin Normal. No se conocen las desviaciones estndar de la poblacin por lo que se utilizar la distribucin t. Se consideran la hiptesis nula y alternativa: H0: 1=2 Vs Ha: 12 Se ajustan los grados de libertad dado que suponemos desviaciones estandares de la poblacin DESIGUAL Se calcula el estadstico de prueba:
Buscando en tablas de la Distribucin t-student con nivel de significancia de 0.1 y 10 grados de libertad, consideramos las regiones crticas -1.812 +1.812 Rechazo Ho Rechazo Ho -2.418 Por lo que se RECHAZA H0, se concluye que la tasa de absorcin media para las 2 marcas de toallas NO es la mis.a Prueba de hiptesis de dos muestras: Muestras dependientes Este mtodo se utiliza cuando las muestras son dependientes o estn relacionadas. Tambin se les conoce como muestras apareadas. Bsicamente lo que vamos a utilizar como muestra ser la distribucin de las medias de las diferencias de ambas muestras. Vamos a explicar esto ltimo por medio de un ejemplo:
Un ejecutivo de crditos hipotecarios de Bancomer recurre a dos empresas dedicadas a Bienes Raices: Century 21 y Kasa; para valuar propiedades que estn susceptibles de venta. Es importante que ambas empresas tengan valores similares en sus avalos. Para realizar esto, Bancomer selecciona 10 casas de forma aleatoria y pide a Century 21 y Kasa realicen su avalos. Entonces, para cada casa, se realizarn 2 avalos, uno realizado por Century 21 y otro por Kasa. Los avalos dependen o estn relacionados con la casa seleccionada. Para la prueba de hiptesis el inters es la distribucin de las diferencias en el valor del avalo de cada casa. Entonces de aqu solo hay 1 muestra. Bancomer intenta saber si la media de la distribucin de las diferencias en los avalos es cero, es decir, sin diferencia o si existe alguna diferencia. La muestra se compone de las diferencias de los avalos de ambas empresas (Century 21 y Kasa). Si ambas empresas reportan estimados similares, entonces algunas veces los avalos de Century 21 sern mayores y otras veces sern los de Kasa. A pesar de esto la media de las diferencias ser cero. Se utilizar d para indicar la media poblacional de la distribucin de las diferencias, suponiendo que la distribucin de las diferencias sigue una distribucin Normal. El estadstico de prueba sigue la distribucin t student (con n-1 grados de libertad) y se calcula:
d : es la media de las diferencias entre las observaciones apareadas o relacionadas. S d : desviacin estndar de las diferencias entre las observaciones apareadas o relacionadas. n : nmero de observaciones apareadas. S d se calcula de manera similar al clculo normal de la desviacin estndar, nicamente cambiando x por d, es decir: Ejemplo Del ejemplo de los avalos a 10 casas, si tuviramos los resultados siguientes:
Con un nivel de significancia de 0.05 se puede concluir que hay una diferencia en los avalos medios de las casas?
1. Formular hiptesis nula y alternativa: Ho: d = 0 Vs Ha: d 0 2. Hay 10 casas valuadas por ambas empresas, entonces n=10 y gl= 10-1=9. Se tiene una prueba de dos colas a un nivel de significancia de 0.05 (=0.05). Buscando en tablas t student para determinar valores crticos:
-2.262 +2.262 Rechazo Ho Rechazo Ho Calculando el estadstico de prueba: -2.262 +2.262 3.305 Se rechaza Ho, concluyndose que la distribucin de las diferencias de la poblacin NO tiene una media de 0, hay una diferencia en los avalos medios de las casas.