Folleto de Apoyo para ANOVA
Folleto de Apoyo para ANOVA
Folleto de Apoyo para ANOVA
I. Objetivo
Analizar, comparar e interpretar datos por medio del análisis de las varianzas ANOVA,
solucionando con creatividad los problemas.
Las pruebas que hemos aprendido hasta ahora, nos permiten probar hipótesis que
examinan la diferencia entre dos medias solamente. El análisis de la varianza o ANOVA
nos permitirá probar la diferencia entre dos o más medias examinando el cociente de la
variabilidad entre dos condiciones y de la variabilidad dentro de cada condición. Por
ejemplo, digamos que suministramos una droga que creamos mejorará la memoria a un
grupo de personas y demos un placebo a otro grupo. Podríamos medir el funcionamiento
de la memoria por el número de las palabras recordadas de una lista que pedimos a
cada uno para memorizar. Una prueba t compararía la probabilidad de observar la
diferencia entre los números medios de las palabras recordadas por cada grupo. Una
prueba ANOVA, por otra parte, compararía la variabilidad que observamos entre las dos
condiciones a la variabilidad observada dentro de cada condición. Recuerde que
medimos variabilidad como la suma de la diferencia de cada valor con respecto a la
media. Cuando realmente calculamos un ANOVA utilizaremos una fórmula atajo.
Por lo tanto, cuando la variabilidad que predecimos entre dos grupos es mucho mas
grande que la variabilidad que no pudimos predecir dentro de cada grupo, concluiremos
que nuestro tratamiento produce resultados diferentes.
Considere las muestras aleatorias (enteros pequeños, solo para efectos ilustrativos mientras
se ahorra espacio) siguientes que corresponden a tres poblaciones diferentes.
y alternativa:
Ha: al menos dos de las medias no son iguales.
1
Statistical Thinking for Managerial Decisions
http://home.ubalt.edu/ntsbarsh/Business-stat/opre504S.htm#rreganovachi
1
Suma Media
Muestra P1 2 3 1 3 1 10 2
Muestra P2 3 4 3 5 0 15 3
Muestra P3 5 5 5 3 2 20 4
Esto es, la suma de los cuadrados totales (SCT) igual a la suma de los cuadrados entre
(SCE) los grupos mas la suma de los cuadrados dentro (SCD) de los grupos.
Muestra P1 1 0 4 0 4 9
Muestra P2 0 1 0 4 9 14
Muestra P3 4 4 4 0 1 13
Suma
Muestra P1 1 1 1 1 1 5
Muestra P2 0 0 0 0 0 0
Muestra P3 1 1 1 1 1 5
2
Tercero, calcule la suma de los cuadrados de las diferencias dentro de cada muestra
usando sus propias medias muestrales. Esto provee una suma de los cuadrados de las
desviaciones DENTRO de todas las muestras.
Suma
Muestra P1 0 1 1 1 1 4
Muestra P2 0 1 0 4 9 14
Muestra P3 1 1 1 1 4 8
SCD = 26 con gl = 3(5-1) = 12. Esto es, 3 grupos por (5 observaciones en cada -1)
Los resultados son: SCT = SCE + SCD, y gl SCT = glSCE + glSCD, como se esperaba.
Ahora, construya la tabla ANOVA para este ejemplo numérico colocando los resultados
de sus cálculos en esta tabla. Note que, los Cuadrados de las Medias son la Suma de los
cuadrados divididos por sus Grados de Libertad. El estadístico F es el cociente de las dos
Medias al Cuadrado.
Tabla ANOVA
Origen de la Suma de Grados de Medias al Estadístico
Variación Cuadrados Libertad Cuadrado F
Entre Muestras 10 2 5 2,30
Dentro de las 26 12 2.17
Muestras
Total 36 14
La lógica detrás de ANOVA: Primero, intentemos explicar la lógica y después ilustrarla con
un ejemplo simple. En la ejecución de la prueba de ANOVA, estamos intentando
determinar si un cierto número de medias poblacionales son iguales. Para hacer esto,
medimos la diferencia de las medias muestrales y las comparamos con la variabilidad
dentro de las observaciones de la muestra. Esta es la razón del porqué la prueba
estadística es el cociente de la variación entre muestra (VEM) y de la variación dentro-
muestra (VDM). Si este cociente está cerca de 1, existe evidencia de que las medias
poblacionales son iguales.
Esta es un buen uso para usted: Mucha gente cree que en el mundo de los negocios, los
hombres perciben mejor salario que las mujeres, simplemente por ser del género
masculinos. Para justificar o rechazar tal proposición, se podría mirar la variación dentro de
cada grupo (un grupo que es el salario percibido por las mujeres y el otro grupo el
percibido por hombres) y compararlos con la variación entre las medias de las muestras
aleatoriamente seleccionadas de cada población. Si la variación en los salarios de las
mujeres es mucho mayor que la variación entre la media de los salarios de los hombres y
3
de las mujeres, uno podría decir que porque la variación es muy grande dentro del grupo
de las mujeres, esto podría no ser un problema relacionado al género.
Construcción del Cuadro de Control para las Medias de la Muestra: Bajo la hipótesis nula,
el ANOVA concluye que µ1 = µ2 = µ3; es decir, tenemos una “población familiar
hipotética.” La pregunta es, ¿cuál es su varianza? La varianza estimada (es decir, los
cuadrados de las medias totales) es 36/14 = 2,57. De esta forma, la desviación estándar
estimada es = 1,60 y la desviación estándar estimada para las medias es 1,6/ 5 ½ = 0,71.
Bajo las condiciones de ANOVA, podemos construir un cuadro de control con los límites
de cuidado = 3 ± 2(0,71); Los límites de acción = 3± 3(0,71). La figura siguiente representa el
cuadro de control.
III. Bibliografía