Ejercicio Anova de Un Factor

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 4

12Lind(410-460).

qxd 27/11/11 09:28 Página 420

420 CAPÍTULO 12 Análisis de la varianza

Ejemplo Desde hace algún tiempo las aerolíneas han reducido sus servicios, como alimentos y bocadi-
llos durante sus vuelos, y empezaron a cobrar un precio adicional por algunos de ellos, como
llevar sobrepeso de equipaje, cambios de vuelo de último momento y por mascotas que via-
jan en la cabina. Sin embargo, aún están muy preocupadas por el servicio que ofrecen. Hace
poco un grupo de cuatro aerolíneas contrató a Brunner Marketing Research, Inc., para encues-
tar a sus pasajeros sobre la adquisición de boletos, abordaje, servicio durante el vuelo, mane-
jo del equipaje, comunicación del piloto, etc. Hicieron 25 preguntas con diversas respuestas
posibles: excelente, bueno, regular o deficiente. Una respuesta de excelente tiene una califica-
ción de 4, bueno 3, regular 2 y deficiente 1. Estas respuestas se sumaron, de modo que la cali-
ficación final fue una indicación de la satisfacción con el vuelo. Entre mayor la calificación,
mayor el nivel de satisfacción con el servicio. La calificación mayor posible fue 100.
Brunner seleccionó y estudió al azar pasajeros de las cuatro aerolíneas. A continuación se
muestra la información. ¿Hay alguna diferencia entre los niveles de satisfacción medios con
respecto a las cuatro aerolíneas? Use el nivel de significancia de 0.01.

Northern WTA Pocono Branson


94 75 70 68
90 68 73 70
85 77 76 72
80 83 78 65
88 80 74
68 65
65

Utilice el procedimiento de prueba de hipótesis de cinco pasos.


Solución
Paso 1: Formule las hipótesis nula y alternativa. La hipótesis nula es que las calificacio-
nes medias de las cuatro aerolíneas son iguales.

H0: ␮1 ⫽ ␮2 ⫽ ␮3 ⫽ ␮4

La hipótesis alternativa es que no todas las calificaciones medias son iguales.

H1: No todas las calificaciones medias son iguales.

La hipótesis alternativa también se considera como “al menos dos calificaciones


medias no son iguales”.
Si no se rechaza la hipótesis nula, se concluye que no hay una diferencia
entre las calificaciones medias de las cuatro aerolíneas. Si se rechaza H0, se con-
cluye que hay una diferencia en al menos un par de calificaciones medias, pero
en este punto no se sabe cuál par o cuántos pares difieren.
Paso 2: Seleccione el nivel de significancia. Seleccionó el nivel de significancia de 0.01.
Paso 3: Determine el estadístico de prueba. El estadístico de prueba sigue la distribu-
ción F.
Paso 4: Formule la regla de decisión. Para determinar la regla de decisión, necesita el
valor crítico. El valor crítico del estadístico F aparece en el apéndice B.4. Los va-
lores críticos del nivel de significancia 0.05 se encuentran en la primera página, y
el nivel de significancia de 0.01, en la segunda. Para utilizar esta tabla necesita
conocer los grados de libertad del numerador y del denominador. Los grados de
libertad del numerador son iguales al número de tratamientos, designado k,
menos 1. Los grados de libertad del denominador son el número total de obser-
vaciones, n, menos el número de tratamientos. En este ejemplo hay cuatro trata-
mientos y un total de 22 observaciones.

Grados de libertad del numerador ⫽ k – 1 ⫽ 4 – 1 ⫽ 3


Grados de libertad del denominador ⫽ n – k ⫽ 22 – 4 ⫽ 18
12Lind(410-460).qxd 27/11/11 09:28 Página 421

12.5 La prueba ANOVA 421

Consulte el apéndice B.4 y el nivel de significancia de 0.01. Muévase horizontal-


mente por la parte superior de la página a tres grados de libertad del numerador.
Después vaya hacia abajo por esa columna hasta la fila con 18 grados de liber-
tad. El valor en esta intersección es 5.09. Por lo tanto, la regla de decisión es
rechazar H0 si el valor calculado de F es mayor que 5.09.
OA4 Organizar datos en Paso 5: Seleccione la muestra, realice los cálculos y tome una decisión. Es convenien-
una tabla ANOVA para su te resumir los cálculos del estadístico F en una tabla ANOVA. El formato de una
análisis. tabla ANOVA es como sigue. En los paquetes de software estadístico también se
emplea este formato.

Tabla ANOVA
Fuente de variación Suma de cuadrados Grados de libertad Media cuadrática F
Tratamientos SST k ⫺1 SST兾(k ⫺ 1) ⫽ MST MST兾MSE
Error SSE n⫺k SSE兾(n ⫺ k) ⫽ MSE
Total SS total n⫺1

Hay tres valores, o suma de cuadrados, para calcular el estadístico de prueba F. Estos
valores se determinan al obtener SS total y SSE, después SST mediante una resta. El término
SS total es la variación total, SST es la variación debida a los tratamientos, y SSE es la varia-
ción dentro de los tratamientos o el error aleatorio.
En general, el proceso se inicia al determinar SST total: la suma de las diferencias eleva-
das al cuadrado entre cada observación y la media global. La fórmula para determinar SS total
es:
SS total ⫽ ©(X ⫺ XG)2 (12-2)
donde:
X es cada observación de la muestra.
XG es la media global o total.
En seguida se determina SSE o la suma de los errores elevados al cuadrado: la suma de
las diferencias elevadas al cuadrado entre cada observación y su respectiva media de trata-
miento. La fórmula para encontrar SSE es:
SSE ⫽ ©(X ⫺ Xc)2 (12-3)
donde:
Xc es la media muestral del tratamiento c.
A continuación se presentan los cálculos detallados de SS total y SSE de este ejemplo.
Para determinar los valores de SS total y SSE se comienza por calcular la media global o total.
Hay 22 observaciones y el total es 1 664, por lo cual la media total es 75.64.
1 664
XG 75.64
22
Northern WTA Pocono Branson Total
94 75 70 68
90 68 73 70
85 77 76 72
80 83 78 65
88 80 74
68 65
65
Total de
la columna 349 391 510 414 1 664
n 4 5 7 6 22
Media 87.25 78.20 72.86 69.00 75.64
12Lind(410-460).qxd 27/11/11 09:28 Página 422

422 CAPÍTULO 12 Análisis de la varianza

Luego se encuentra la desviación de cada observación a la media total: se elevan al


cuadrado estas desviaciones y se suma el resultado de las 22 observaciones. Por ejemplo,
el primer pasajero encuestado tenía una calificación de 94, y la media global o total es
75.64. Por lo tanto, (X ⫺ XG) ⫽ 94 ⫺ 75.64 ⫽ 18.36. En el caso del último pasajero, (X ⫺ XG)
⫽ 65 ⫺ 75.64 ⫽ ⫺10.64. Los cálculos relativos a los otros pasajeros son:

Northern WTA Pocono Branson


18.36 ⫺0.64 ⫺5.64 ⫺7.64
14.36 ⫺7.64 ⫺2.64 ⫺5.64
9.36 1.36 0.36 ⫺3.64
4.36 7.36 2.36 ⫺10.64
12.36 4.36 ⫺1.64
⫺7.64 ⫺10.64
⫺10.64

Después se eleva al cuadrado cada una de estas diferencias y se suman todos los valores. Así,
en el caso del primer pasajero:
(X ⫺ XG)2 ⫽ (94 ⫺ 75.64)2 ⫽ (18.36)2 ⫽ 337.09
Por último, se suman todas las diferencias elevadas al cuadrado, como se indica en la fórmu-
la (12-2). El valor SS total es 1 485.10.

Northern WTA Pocono Branson Total


337.09 0.41 31.81 58.37
206.21 58.37 6.97 31.81
87.61 1.85 0.13 13.25
19.01 54.17 5.57 113.21
152.77 19.01 2.69
58.37 113.21
113.21
Total 649.92 267.57 235.07 332.54 1 485.10

Para calcular el término SSE se encuentra la desviación entre cada observación y su media de
tratamiento. En el ejemplo, la media del primer tratamiento (es decir, los pasajeros en Northern
Airlines) es 87.25, determinada mediante XN ⫽ 349兾4. El subíndice N se refiere a Northern Air-
lines.
El primer pasajero calificó a Northern con 94, por lo que (X ⫺ X N ) ⫽ (94 ⫺ 87.25) ⫽ 6.75.
El primer pasajero del grupo de TWA respondió con una calificación total de 75, por lo cual
(X ⫺ X W ) ⫽ (75 ⫺ 78.20) ⫽ ⫺3.2. El detalle de todos los pasajeros es:

Northern WTA Pocono Branson


6.75 ⫺3.2 ⫺2.86 ⫺1
2.75 ⫺10.2 0.14 1
⫺2.25 ⫺1.2 3.14 3
⫺7.25 4.8 5.14 ⫺4
9.8 7.14 5
⫺4.86 ⫺4
⫺7.86
12Lind(410-460).qxd 27/11/11 09:28 Página 423

12.5 La prueba ANOVA 423

Cada uno de estos valores se eleva al cuadrado y después se suman las 22 observaciones.
Los valores se muestran en la siguiente tabla.

Northern WTA Pocono Branson Total


45.5625 10.24 8.18 1
7.5625 104.04 0.02 1
Estadística en acción 5.0625 1.44 9.86 9
¿Alguna vez ha estado 52.5625 23.04 26.42 16
esperando que se des- 96.04 50.98 25
ocupe un teléfono pú- 23.62 16
blico y la persona que 61.78
lo usa pareciera hablar Total 110.7500 234.80 180.86 68 594.41
sin parar? Existe eviden-
cia de que la gente
habla más por un teléfo-
no público cuando
Por lo tanto, el valor SSE es 594.41. Es decir, ©(X ⫺ Xc)2 ⫽ 594.41.
alguien está esperando
que lo desocupe. En
Por último, se determina SST, la suma de los cuadrados debida a los tratamientos, con la
una encuesta reciente resta:
en un centro comercial,
los investigadores midie- SST ⫽ SS total ⫺ SSE (12-4)
ron el tiempo que 56
compradores pasaron En este ejemplo:
hablando por teléfono:
1) cuando estaban solos, SST SS total SSE 1 485.10 594.41 890.69
2) cuando una persona
estaba usando el teléfo- Para determinar el valor calculado de F, consulte la tabla ANOVA. Los grados de libertad del
no de al lado y 3) cuan- numerador y del denominador son los mismos que en el paso 4 en la página 420, donde se
do una persona estaba determinó el valor crítico de F. El término media cuadrática es otra expresión de la estimación
usando un teléfono de de la varianza. La media cuadrática de tratamientos es SST dividido entre sus grados de liber-
al lado y alguien espera- tad. El resultado es la media cuadrática de tratamientos, y se escribe MST. Calcule el error
ba su turno. El estudio, medio cuadrático de una manera similar. Para ser precisos, divida SSE entre sus grados de
que aplicó la técnica libertad. Para completar el proceso y obtener F, divida MST entre MSE.
ANOVA de una vía, Sustituya los valores particulares de F en una tabla ANOVA y calcule el valor de F, como
demostró que el tiempo
se muestra a continuación.
medio de uso del teléfo-
no era significativamen-
te menor cuando la
persona estaba sola. Fuente de variación Suma de cuadrados Grados de libertad Media cuadrática F
Tratamientos 890.69 3 296.90 8.99
Error 594.41 18 33.02
Total 1 485.10 21

El valor calculado de F es 8.99, mayor que el valor crítico de 5.09, por lo que la hipótesis
nula se rechaza. La conclusión es que no todas las medias poblacionales son iguales. Las cali-
ficaciones medias de las cuatro aerolíneas no son iguales. Es probable que las calificaciones
de los pasajeros se relacionen con una de ellas. En este punto sólo es posible concluir que hay
una diferencia entre las medias del tratamiento. No se puede determinar cuáles ni cuántos gru-
pos de tratamientos difieren.

Como se hizo notar en el ejemplo previo, los cálculos son tediosos si la cantidad de obser-
vaciones en cada tratamiento es extensa. Hay muchos paquetes de software para generar
estos resultados. A continuación se presenta la captura de pantalla de Excel en forma de una
tabla ANOVA para el ejemplo anterior, con las calificaciones de aerolíneas y de pasajeros.

También podría gustarte