Guia 16. Analisis de Varianza
Guia 16. Analisis de Varianza
Guia 16. Analisis de Varianza
INTENCIONALIDAD
H0 : µ1 = µ2 = µ3 = ... = µk
La hipótesis alternativa plantea que existe alguna diferencia entre las medias, que no todas la medias
poblacionales son iguales:
Ha : Hay alguna media diferente
El análisis de varianza compara la variación debida a unas determinadas fuentes con la variación existente
entre individuos que deberı́an ser similares. En particular, la prueba ANOVA contrasta si varias poblaciones
tienen la misma media, comparando lo separadas que están entre sı́ las medias muestrales en relación con
la variación existente dentro de la muestras.
Requisitos para hacer una prueba de hipótesis
Las poblaciones tienen distribuciones que son aproximadamente normales.
Las poblaciones tienen la misma varianza σ 2 (o desviación estándar σ).
2
La SC(del tratamiento), también llamada SC(del factor), SC(entre grupos) o SC(entre muestras), es una
medida de la variación entre las medias muestrales.
k
X
SCT R = ¯ )2
ni (x̄i − x̄
i=1
La SC(del error), también conocida como SC(dentro de grupos) o SC(dentro de muestras), es una suma de
cuadrados que representa la variación que se supone común a todas las poblaciones consideradas.
k
X
SCE = (ni − 1)s2i
i=1
Dadas las expresiones anteriores para SC(total), SC(del tratamiento) y SC(del error), siempre deben man-
tenerse la siguiente relación.
SCT = SCT R + SCE
3
Cuadrados medios
Si dividimos cada una de los cuadrados entre su número correspondiente de grados de libertad, obtenemos
los cuadrados medios. Cuadrado medio del tratamiento se obtiene
SCT R
CM T R =
k−1
Cuadrado medio del error se obtiene
SCE
CM E =
n−k
Cuadrado medio total se obtiene
SCT
CM T =
n−1
Al probar la hipótesis nula
H0 : µ1 = µ2 = µ3 = ... = µk
contra la hipótesis alterna
Ha : Hay alguna media diferente
el estadı́stico de prueba
CM T R
F =
CM E
Tiene una distribución F con (k − 1) grados de libertad del numerador y (n − k) grados de libertad del
denominador.
Una manera adecuada de representar los cálculos anteriores se usa una tabla conocida como tabla ANOVA
Fuente SC gl CM F Valor P
Tratamientos SCT R k−1 CM T R = SCT R/(k − 1) CM T R/CM E
Error SCE n−k CM E = SCE/(n − k)
Total SCT n−1
EJEMPLOS
Ejemplo 1.
Una empresa fabrica en sus tres fabricas situadas en tres ciudades diferentes impresora y computadoras. Con
el fin de medir los conocimientos que tienen los empleados de estas tres plantas acerca de la administración
de la calidad, se toma una muestra aleatoria de 6 empleados de cada fabrica y se les aplica un examen acerca
de su conocimiento de la calidad. Obteniendo las siguientes puntuaciones
Fabrica 1 85 75 82 76 71 85
Fabrica 2 71 75 73 74 69 82
Fabrica 3 59 64 62 69 75 67
El administrador de la empresa quiere usar estos datos para probar la hipótesis de que la media de las
puntuaciones de los exámenes es la misma de las tres fabricas.
Hagamos el supuesto de que cumple los requisitos para hacer un análisis de varianza. Solución:
Usando el programa R nos proporciona tabla ANOVA del problema.
4
Como el valor P es menor que el nivel de significancia del 5 %, rechazamos la hipótesis nula de que las
medias de la puntuación en los exámenes acerca del conocimiento de la calidad son diferentes, o almenos
hay una media diferente.
EJERCICIOS PROPUESTOS
Para resolver cada uno de los problemas haga uso del programa R (o R studio).
1. En una auditoria los auditores tienen que dar opiniones acerca de diversos aspectos con base en sus
propias experiencias directas, indirectas o en en una combinación de ambas. En estudio se pidió a los
auditores que dieran su opinión acerca de la frecuencia con que se presentan errores en una auditoria.
Suponga que se obtuvieron los resultados que se presentan a continuación: valores bajos indican
opiniones más acertadas.
Use α = 0,05 para determinar si el tipo de experiencia en que se basa la opinión afecta la calidad de
la misma.
2. En publicidad de cuatro pinturas se dice que tienen el mismo tiempo de secado. Para verificar esto,
se prueban cinco muestras de cada una de las pinturas. se registra el tiempo en minutos necesario
para que el secado sea suficiente para la aplicación de una segunda mano. Los datos obtenidos son los
siguientes.
Con α = 0,05 como nivel de significancia, realice una prueba para demostrar si la media de los
tiempos de secado es la misma en todas las pinturas.
5
USANDO R
BIBLIOGRAFÍA
1. Moore, David S. The Basic Practice of Statistics. Fifth Edition. New York WH Freeman and Company
(2010).
2. Triola Mario F. ESTADISTICA. Decimoprimera Edición. Pearson Educación 2013.
3. Devore Jay l. PROBABILIDAD Y ESTADÍSTICA para ingenierı́a y ciencias. Octava edición . Cengage
Learnig 2010
4. Canavos George C. PROBABILIDAD Y ESTADÍSTICA, Aplicaciones y Métodos. Primera edición en
español, Mc Graw Hill 1987.
5. Levin Richard I. y Rubı́n David S. ESTADÍSTICA para ADMINISTRADORES. Sexta edición, Pren-
tice Hall.
6. Anderson David R. Sweeney Dennis J. Williams Thomas A. ESTADÍSTICA PARA ADMINISTRA-
CION Y ECONOMIA. Décima edición, Cengage Learnig.
6
7. Paul Newold, William L. Carlson y Betty Thorne. Estadı́stica para administración y economı́a. Sexta
edición. Prencice Hall.