Ejercicio Anova de Un Factor
Ejercicio Anova de Un Factor
Ejercicio Anova de Un Factor
Ejemplo Desde hace algún tiempo las aerolíneas han reducido sus servicios, como alimentos y bocadi-
llos durante sus vuelos, y empezaron a cobrar un precio adicional por algunos de ellos, como
llevar sobrepeso de equipaje, cambios de vuelo de último momento y por mascotas que via-
jan en la cabina. Sin embargo, aún están muy preocupadas por el servicio que ofrecen. Hace
poco un grupo de cuatro aerolíneas contrató a Brunner Marketing Research, Inc., para encues-
tar a sus pasajeros sobre la adquisición de boletos, abordaje, servicio durante el vuelo, mane-
jo del equipaje, comunicación del piloto, etc. Hicieron 25 preguntas con diversas respuestas
posibles: excelente, bueno, regular o deficiente. Una respuesta de excelente tiene una califica-
ción de 4, bueno 3, regular 2 y deficiente 1. Estas respuestas se sumaron, de modo que la cali-
ficación final fue una indicación de la satisfacción con el vuelo. Entre mayor la calificación,
mayor el nivel de satisfacción con el servicio. La calificación mayor posible fue 100.
Brunner seleccionó y estudió al azar pasajeros de las cuatro aerolíneas. A continuación se
muestra la información. ¿Hay alguna diferencia entre los niveles de satisfacción medios con
respecto a las cuatro aerolíneas? Use el nivel de significancia de 0.01.
H0: 1 ⫽ 2 ⫽ 3 ⫽ 4
Tabla ANOVA
Fuente de variación Suma de cuadrados Grados de libertad Media cuadrática F
Tratamientos SST k ⫺1 SST兾(k ⫺ 1) ⫽ MST MST兾MSE
Error SSE n⫺k SSE兾(n ⫺ k) ⫽ MSE
Total SS total n⫺1
Hay tres valores, o suma de cuadrados, para calcular el estadístico de prueba F. Estos
valores se determinan al obtener SS total y SSE, después SST mediante una resta. El término
SS total es la variación total, SST es la variación debida a los tratamientos, y SSE es la varia-
ción dentro de los tratamientos o el error aleatorio.
En general, el proceso se inicia al determinar SST total: la suma de las diferencias eleva-
das al cuadrado entre cada observación y la media global. La fórmula para determinar SS total
es:
SS total ⫽ ©(X ⫺ XG)2 (12-2)
donde:
X es cada observación de la muestra.
XG es la media global o total.
En seguida se determina SSE o la suma de los errores elevados al cuadrado: la suma de
las diferencias elevadas al cuadrado entre cada observación y su respectiva media de trata-
miento. La fórmula para encontrar SSE es:
SSE ⫽ ©(X ⫺ Xc)2 (12-3)
donde:
Xc es la media muestral del tratamiento c.
A continuación se presentan los cálculos detallados de SS total y SSE de este ejemplo.
Para determinar los valores de SS total y SSE se comienza por calcular la media global o total.
Hay 22 observaciones y el total es 1 664, por lo cual la media total es 75.64.
1 664
XG 75.64
22
Northern WTA Pocono Branson Total
94 75 70 68
90 68 73 70
85 77 76 72
80 83 78 65
88 80 74
68 65
65
Total de
la columna 349 391 510 414 1 664
n 4 5 7 6 22
Media 87.25 78.20 72.86 69.00 75.64
12Lind(410-460).qxd 27/11/11 09:28 Página 422
Después se eleva al cuadrado cada una de estas diferencias y se suman todos los valores. Así,
en el caso del primer pasajero:
(X ⫺ XG)2 ⫽ (94 ⫺ 75.64)2 ⫽ (18.36)2 ⫽ 337.09
Por último, se suman todas las diferencias elevadas al cuadrado, como se indica en la fórmu-
la (12-2). El valor SS total es 1 485.10.
Para calcular el término SSE se encuentra la desviación entre cada observación y su media de
tratamiento. En el ejemplo, la media del primer tratamiento (es decir, los pasajeros en Northern
Airlines) es 87.25, determinada mediante XN ⫽ 349兾4. El subíndice N se refiere a Northern Air-
lines.
El primer pasajero calificó a Northern con 94, por lo que (X ⫺ X N ) ⫽ (94 ⫺ 87.25) ⫽ 6.75.
El primer pasajero del grupo de TWA respondió con una calificación total de 75, por lo cual
(X ⫺ X W ) ⫽ (75 ⫺ 78.20) ⫽ ⫺3.2. El detalle de todos los pasajeros es:
Cada uno de estos valores se eleva al cuadrado y después se suman las 22 observaciones.
Los valores se muestran en la siguiente tabla.
El valor calculado de F es 8.99, mayor que el valor crítico de 5.09, por lo que la hipótesis
nula se rechaza. La conclusión es que no todas las medias poblacionales son iguales. Las cali-
ficaciones medias de las cuatro aerolíneas no son iguales. Es probable que las calificaciones
de los pasajeros se relacionen con una de ellas. En este punto sólo es posible concluir que hay
una diferencia entre las medias del tratamiento. No se puede determinar cuáles ni cuántos gru-
pos de tratamientos difieren.
Como se hizo notar en el ejemplo previo, los cálculos son tediosos si la cantidad de obser-
vaciones en cada tratamiento es extensa. Hay muchos paquetes de software para generar
estos resultados. A continuación se presenta la captura de pantalla de Excel en forma de una
tabla ANOVA para el ejemplo anterior, con las calificaciones de aerolíneas y de pasajeros.