Análisis de Varianza

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 52

CAPÍTULO

X
ANÁLISIS DE LA VARIANZA

1. Introducción
El resultado de un experimento puede ser diferente al realizarlo
varias veces, aunque las condiciones bajo las que se realiza sean
siempre las mismas. Ello es consecuencia de las variaciones de muchos
factores fuera de nuestro control que no permanecen constantes y que
influyen en el resultado del experimento. Si además se cambian las
condiciones en las que se realiza el experimento, el resultado del
mismo variará en mayor medida.
Como por ejemplo, podemos considerar los rendimientos de un
mismo cultivo en parcelas diferentes, que aunque labradas en las
mismas condiciones, producen cosechas que son distintas. Esta
variabilidad de rendimientos es producida por una multitud de factores
controlables (fertilizante, riego, etc.), donde cada factor puede presentar
diferentes niveles (diferentes tipos de fertilizante, distintas modalidades
de riego, etc.); sin embargo, la variabilidad también puede ser
producida por factores no controlables como la humedad, el clima, las
plagas, etc.
Teóricamente, es posible dividir la variabilidad del resultado de
un experimento en dos partes: la originada por los factores que influyen
directamente en el resultado del experimento, estudiados en sus
distintos niveles, y la producida por el resto de los factores con
influencia en el resultado, pero que no son controlables y que se le
conoce con el nombre de error experimental.

El análisis de la varianza simple (ANOVA) se presenta cuando


tenemos un solo factor, estudiado en sus diferentes niveles, que influye
sobre una variable respuesta que mide el resultado del experimento, y
el resto de los factores forman el error experimental influyendo en la
variable respuesta de manera no controlable.
656 Estadística para Administración y Economía
2. Análisis de la varianza simple (un solo factor) - La prueba
ANOVA
Otro uso de la distribución F comprende la técnica del análisis de
la varianza (ANOVA), donde se comparan tres o más medias
muestrales para determinar si provienen de poblaciones iguales. Para
usar el ANOVA, se considera lo siguiente:
 Las poblaciones están distribuidas normalmente.
 Las poblaciones tienen desviaciones estándares iguales.
 Las muestras se seleccionan de modo independiente.
Cuando se cumplen estas condiciones, F se utiliza como el valor
estadístico de prueba. El ANOVA tuvo su origen en la agricultura y aún
permanecen muchos de los términos relacionados con ese contexto. En
particular el término tratamiento se emplea para identificar las
poblaciones que se examinan.
2.1. Tratamiento
Causa o fuente específica de variación en un conjunto de datos. El
siguiente ejemplo aclarará el término tratamiento y mostrará una
aplicación del ANOVA.
Juan Pérez, propietario de la parcela Los Algarrobos, desea usar
la marca de fertilizantes que produzca el máximo rendimiento de arroz
por hectárea. El señor Pérez puede escoger entre tres marcas
comerciales: K24, Z38, P50. Para comenzar divide el campo de cultivo
en 12 lotes de igual tamaño, después planta arroz al mismo tiempo y de
la misma forma; la única diferencia en las parcelas es que asigna al azar
la marca del fertilizante K24 para cuatro lotes, Z38 para otros cuatro y
P50 para las últimas cuatro parcelas. Al final de la temporada de
crecimiento se registra el número de quintales de arroz producidos en
cada lote. En este ejemplo hay tres tratamientos, que son los niveles del
factor fertilizante, estas son las tres diferentes clases de fertilizante. Los
resultados en quintales al final de la temporada de crecimiento son:

K24 Z38 P50


55 66 47
54 76 51
59 67 46
56 71 48
¿Existe una diferencia en el número promedio de quintales de
arroz producido?
Análisis de la varianza 657
Una respuesta a esta pregunta permitirá comparar los tres
tratamientos utilizando la distribución t para comparar las tres medias
de muestra, se tendría que efectuar tres pruebas distintas t. Es decir, se
necesitaría comparar la producción media de cada tratamiento esto es:
K24 vs. Z38, K24 vs. P50, Z38 vs. P50. Si se establece un nivel de
significancia de 0.05, la probabilidad de una decisión correcta es 0.95,
que resulta de 1–0.05. Por lo tanto, la probabilidad de adoptar una
decisión correcta debido al muestreo de cualesquiera de las tres pruebas
sería (0.95)3 = 0.857 y la probabilidad de decidir incorrectamente sería
1–0.857 = 0.143, de modo que si se realizan tres pruebas
independientes usando la distribución t, la probabilidad de al menos
cometer un error de muestreo aumenta de 0.05 a un nivel de
significancia de 0.143. Es obvio que se necesita un mejor método que
el de realizar tres pruebas. El ANOVA permitirá comparar las medias
de tratamiento de forma simultánea y evita la aparición del error tipo II.
2.2. Proceso de una prueba de hipótesis con el ANOVA
Recuérdese que se desea determinar si las diversas medias de
muestra provinieron de una o varias poblaciones con medias distintas.
En realidad se comparan estas muestras por medio de sus varianzas,
uno de los supuestos para aplicar el ANOVA es que las desviaciones
estándares de las diferentes poblaciones tienen que ser iguales. En la
prueba ANOVA se toma ventaja de esta condición. La estrategia
fundamental es calcular la varianza poblacional de dos formas, y
después encontrar la razón de estas dos estimaciones. Si la razón es
aproximadamente uno, por lógica los dos cálculos son iguales y se
concluye que las medias de las muestras son las mismas. Si la razón es
diferente de uno, se concluye que las medias muestrales no son las
mismas. Pero muchas veces este cálculo es muy tedioso, en particular
cuando los valores no son enteros. Razón por la cual emplearemos el
siguiente procedimiento. Tomemos el ejemplo inicial, y siguiendo el
procedimiento de los cinco pasos para la prueba de hipótesis tenemos:
Paso 1: Plantear la hipótesis nula y la hipótesis alternativa; la hipótesis
nula es que la producción promedio es la misma para los tres
tratamientos.
H 0: 1  2  3
H1: Las producciones promedio no son iguales.
Paso 2: Seleccionar el nivel de significancia.
Se elige   0.01.
Paso 3: Determinar el estadístico de prueba.
Tal valor es la distribución F.
658 Estadística para Administración y Economía
Paso 4: Determinar la regla de decisión. Para establecer la regla de
decisión se necesita el valor crítico, el cual ubicamos en la tabla de
distribución F; para usar esta tabla es necesario conocer los grados de
libertad en el numerador y en el denominador. Tales grados en el
numerador son iguales al número de tratamientos, llamado k, menos
uno y los grados de libertad en el denominador son, el número total de
observaciones, n, menos el número de tratamientos.
Para nuestro problema tenemos: 3 tratamientos y 12 observaciones, por
lo tanto:
g.l. en el numerador = 3–1 = 2
g.l. en el denominador = 12–3 = 9
De acuerdo a la tabla tenemos que:
F 2,9, 0.01  8.02
En ese sentido, la regla de decisión es: rechazar H0 si el valor calculado
de F, calculado con información muestral en la tabla ANOVA, es
mayor a 8.02.
Paso 5: Seleccionar la muestra, realizar los cálculos y tomar una
decisión. Es conveniente resumir las operaciones del cálculo del valor
estadístico F en una tabla ANOVA; el formato para dicha tabla es
como sigue:
TABLA ANOVA
Grados
Fuente de Suma de Cuadrado
de F
variación cuadrados medio
libertad
SST
Tratamiento SST k 1 MST 
k 1 MST
F
SSE MSE
Error SSE nk MSE 
nk
Total SSTotal n 1
Donde:
SST  Suma de cuadrados debido al tratamiento.
SSE  Suma de cuadrados debido al error.
MST  Cuadrado medio debido al tratamiento.
MSE  Cuadrado medio debido al error.

Suma de cuadrados total: SSTotal   x 2 


 x  2
n
Análisis de la varianza 659
Donde:
 x 2: Es la suma de los valores de x elevados al cuadrado.
 x  :
2
Es el cuadrado de la suma de los valores de x.
n: Número total de observaciones.
 Tc2    x  2
Suma de cuadrados debido al tratamiento: SST     
n  n
 c
Donde:
Tc: Total de la columna para cada tratamiento.
nc: Es el número de observaciones (tamaño de la muestra para
cada tratamiento).
Suma de cuadrados debido al error: SSE  SSTotal  SST
Los cálculos para nuestro ejemplo son los siguientes:

K24 Z38 P50 TOTAL


xi xi2 xi xi2 xi 2
x
i

55 3025 66 4356 47 2209


54 2916 76 5776 51 2601
59 3481 67 4489 46 2116
56 3136 71 5041 48 2304
Tc 224 280 192 696
nc 4 4 4 12

x 2
12 558 19 662 9230 41 450

Los elementos para la tabla ANOVA se calculan como sigue:


 x
2
 696 2
SSTotal   x2   41 450   1082
n 12
 T 2   x
2
2242 2802 1922 6962
SST    c      
n
 c n 4 4 4 12
SST  41 360  40 368
SST  992
SSE  SSTotal  SST  1082  992  90
Resumiendo los valores encontrados en la tabla ANOVA para
determinar F.
660 Estadística para Administración y Economía

TABLA ANOVA
Fuente de Suma de Grados de Cuadrado
variación cuadrados libertad medio F
Tratamiento 992 2 496
Error 90 9 10 49.6
Total 1082
El valor de F es 49.6, el cual es mayor que el valor crítico 8.02.
Se rechaza H0, por lo tanto, las medias poblacionales no todas son
iguales.
Ejemplo 2
No Grasa es el nuevo lavavajilla para el hogar, cuya demanda se
prueba exhibiéndolo en tres lugares diferentes dentro de varios
supermercados. A continuación se muestra el número de envases de 45
gramos que se vendieron en cada ubicación:

Lugar Ventas
Cerca del pan 20 15 24 18
Cerca de las cervezas 12 18 10 15
Con otros limpiadores 25 28 30 32

Al nivel de significancia de 0.05 existe una diferencia en el número


medio de botes vendidos en los tres lugares.
a) Plantear las hipótesis nula y alternativa.
b) ¿Cuál es la regla de decisión?
c) Calcule SSTotal, SST, SSE.
d) Desarrolle la tabla ANOVA.
e) ¿Cuál es su decisión con respecto a la hipótesis nula?
Solución
a) H 0: 1  2  3
H1: Las producciones promedio no son iguales
b) g.l. en el numerador = 3 – 1 = 2
g.l. en el denominador =12 – 3 = 9
  0.05
De acuerdo a la tabla tenemos que F 3,9, 0.05  4.26, así que la
regla de decisión es: rechazar H0 si el valor calculado de F es
mayor a 4.26.
Análisis de la varianza 661
c) Datos para realizar los cálculos:

Cerca del Cerca de Con otros


pan las cervezas limpiadores

xi xi2 xi xi2 xi xi2


20 400 12 144 25 625
15 225 18 324 28 784
Ventas
24 576 10 100 30 900
18 324 15 225 32 1024
Tc 77 55 115
nc 4 4 4
x 2
1525 793 3333

 x
2
 247 2
SSTotal   x 2
  5651   566.92
n 12

 T 2   x
2
77 2 552 1152 247 2
SST    c        460.67
n  n 4 4 4 12
 c

d) Tabla ANOVA
TABLA ANOVA
Fuente de Suma de Grados de Cuadrado
F
variación cuadrados libertad medio
Tratamiento 460.67 2 230.335
19.51
Error 106.25 9 11.806
Total 566.92

e) Se rechaza H0.
2.3. Inferencias acerca de las medias de tratamiento
Supóngase que al aplicar el procedimiento ANOVA, se decide
rechazar la hipótesis nula. Esto permite concluir que todas las medias
de tratamiento no son iguales. En algunos casos esta conclusión puede
considerarse satisfactoria; sin embargo, en otros casos no y se desea
saber qué medias de tratamiento son diferentes. Para resolver esta
situación podemos aplicar el procedimiento de la diferencia mínima de
Fisher, para determinar dónde están las diferencias.
662 Estadística para Administración y Economía
La distribución t, que se describió en el capítulo VII, se utiliza
como base para esta prueba. Se debe tener en cuenta que una de las
suposiciones básicas del ANOVA es que las varianzas poblacionales
son iguales para todos los tratamientos. Este valor poblacional común
se denomina error cuadrado medio (MSE). A continuación se detalla el
proceso de Fisher basado en el estadístico de prueba t.
2.3.1. Procedimiento de la diferencia significativa mínima de Fisher
Planteamiento de hipótesis:
H 0: i   j

H1: i  u j

Regla de decisión:

 
2 2

–t t 
( nn–kk,, ) (n – k ,  )

( nk , )
Región de rechazo 22 22 Región de rechazo

Donde:
n: Total de observaciones.
k: Número de tratamientos.
: Nivel de significancia.
Regla de decisión:
Rechazar H 0 si:
t  t ó t t
( n k ,  ) ( nk ,  )
2 2
Estadístico de prueba:
xi  x j
t
1 1
MSE   
 ni n j 
 
Análisis de la varianza 663
Ejemplo 3
Los siguientes datos representan el costo de colegiaturas (en miles
de dólares) de una muestra de universidades privadas en diversas
regiones de Estados Unidos. Al nivel de significancia del 5%, ¿puede
concluirse que existe una diferencia en el costo promedio de las
colegiaturas?
Noreste Sureste Oeste
(miles US$) (miles US$) (miles US$)
10 8 7
11 9 8
12 10 6
10 8 7
12 6
a) Enuncie las hipótesis nula y alternativa.
b) ¿Cuál es la regla de decisión?
c) ¿Cuál es el valor estadístico de prueba calculado?
d) ¿Cuál es su decisión con respecto a la hipótesis nula?
e) ¿Podría haber una diferencia significativa entre la colegiatura
media del Noreste y la del Oeste? Si es así, utilice el
procedimiento de la diferencia significativa mínima de Fisher
para probar dicha diferencia.
Solución
a) Planteamiento de hipótesis:
H 0: 1  2  3
H1: No todas las medias son iguales.
b) g.l. en el numerador = 3 – 1= 2
g.l. en el denominador = 14 – 3 = 11
  0.05
De acuerdo a la tabla tenemos que el valor F 2,11,0.05  3.98, así
que la regla de decisión es: rechazar H0 si el valor calculado de F
es mayor a 3.98.
 x
2
124 
2

c) SSTotal   x 2
  1152   53.71
n 14
 T 2   x
2
552 352 342 1242
SST    c        44.16
n
 c  n 5 4 5 14
SSE  53.71  44.16  9.55
664 Estadística para Administración y Economía
Estos valores se han calculado de acuerdo a la siguiente tabla:

Noreste Sureste Oeste


(miles US$) (miles US$) (miles US$)

xi xi2 xi xi2 xi xi2


10 100 8 64 7 49
11 121 9 81 8 64
12 144 10 100 6 36
10 100 8 64 7 49
12 144 6 36
Tc 55 35 34
nc 5 4 5

x 2
609 309 234

Para calcular el estadístico de prueba se hace uso de la tabla


ANOVA:
TABLA ANOVA
Fuente de Suma de Grados de Cuadrado
F
variación cuadrados libertad medio
Tratamiento 44.16 2 22.08
25.43
Error 9.55 11 0.8682
Total 53.71 13

d) Se rechaza H 0 , las medidas de tratamiento difieren.


e) Ahora aplicaremos el procedimiento de la diferencia mínima de
Fisher para determinar si hay diferencia significativa entre la
colegiatura media de la población Noreste y la del Oeste.
Planteamiento de hipótesis:
H 0: 1  3
H1: 1  3
Regla de decisión:
Rechazar H 0 si t  2.201 ó t  2.201
Análisis de la varianza 665

Región de rechazo

0.025 Zona de aceptación 0.025

–tt(0.025,11)
(0.025,11)
 – 2.201
2.20 t(0.025 ,11) 
t(0.025,11)  2.201
2.20

Estadístico de prueba:
xi  x j
t
1 1
MSE   
 ni n j 
 
De acuerdo a los datos se obtienen las siguientes medias
muestrales:
Noreste Sureste Oeste
(miles US$) (miles US$) (miles US$)
10 8 7
11 9 8
12 10 6
10 8 7
12 6
xi 11 8.75 6.8
ni 5 4 5

Asimismo, necesitamos MSE  0.8682 , ahora reemplazando en


la fórmula para determinar el valor t:
11  6.8
t  7.127
  1 1 
 0.8682  5  5  
  
Decisión:
Se rechaza H 0 , esto quiere decir que existe diferencia
significativa entre la colegiatura media del Noreste y la del Oeste.
666 Estadística para Administración y Economía
3. Análisis de la varianza con dos factores: una observación por
celda, bloques aleatorizados
En la prueba ANOVA, se dividió la variación total en dos
categorías: la variación entre los tratamientos y la variación dentro de
los mismos. A esta última también se le denominó el error o la
variación aleatoria. Es decir, se consideraron solo dos fuentes de
variación, la causada por los tratamientos y la debida al azar. Sin
embargo, podríamos suponer que un segundo factor pudiera tener
influencia en el resultado. El beneficio de considerar otros factores es
que se puede reducir la varianza del error. Esto es, si se puede
disminuir el denominador del valor estadístico F (reduciendo la
varianza del error o más directamente, el término SSE) el valor F será
más grande, haciendo que se rechace la hipótesis de medias de
tratamientos iguales.
3.1. Procedimiento de análisis de varianza con dos factores: una
observación por celda, bloques aleatorizados
Para este procedimiento se requiere dividir la suma (SSTotal) en
tres grupos: la suma de cuadrados debida al tratamiento, la debida a
bloques y la debida al error, esto es:

Suma de cuadrados entre


grupos (debida al tratamiento)

Suma de cuadrados entre


Suma de cuadrados
total bloques

Suma de cuadrados entre


errores

SS Total  SST  SSB  SSE


Esta partición de la suma de cuadrados se condensa en la tabla de
análisis de varianza para el diseño de bloques aleatorizados, que se
muestra a continuación:
Análisis de la varianza 667

TABLA ANOVA
Fuente de Suma de Grados de
Cuadrado medio F
variación cuadrados libertad
SST MST
Tratamiento SST k 1 MST 
k 1 MSE
SSB MSB
Bloques SSB b 1 MSB 
b 1 MSE
SSE
Error SSE (k  1)(b  1) MSE 
(k  1)(b  1)
Total SSTotal n 1
Donde:
SSB : Bloques de suma de cuadrados y se calcula con la siguiente
fórmula:
 B2    x 
2

SSB    r  
 k  n
Br: Se refiere al total de bloques, esto es, el total para la fila, y k
es el número de elementos en cada bloque.
SSE:Error de suma de cuadrados, dos direcciones; asimismo:
SSE  SS Total  SST  SSB
b: Número de bloques.
Ejemplo 4
La empresa Colan Shampoo vende tres tipos de champú: para
cabello seco, normal y graso. Las ventas, en miles de soles, durante los
últimos cinco meses, se presentan en la siguiente tabla:
Ventas (miles S/.)
Mes Seco Normal Graso
Junio 7 9 12
Julio 11 12 14
Agosto 13 11 8
Septiembre 8 9 7
Octubre 9 10 13
Utilizando el nivel de 0.05, aplique el procedimiento ANOVA
para probar si:
a) Las ventas promedio de los tipos de producto para cabello seco,
normal y graso son iguales.
668 Estadística para Administración y Economía
b) Las ventas promedio son las mismas para cada uno de los cinco
meses.
Solución
Planteamiento de hipótesis:
a) y b)
Primero se probará la hipótesis referente a las medias de
tratamiento, es decir, para los tipos de champú:
H0: 1 = 2 = 3
H1: Las medias de tratamiento no son iguales.
g.l. en el numerador = k – 1 = 3 – 1 = 2
g.l. en el denominador : (b  1)(k  1)  (5  1)(3  1)  8
  0.05
De acuerdo a la tabla tenemos que el valor es F 2,8, 0.05  4.46,
así la regla de decisión es: rechazar H0 si el valor calculado de F
es mayor a 4.46.
Ahora plantearemos la hipótesis para el segundo factor, es decir,
los meses:
H0: 1 = 2 = 3= 4 = 5
H1: Las medias de bloques no son iguales.
g.l. en el numerador: b  1  5  1  4
g.l. en el denominador : (b  1)(k  1)  (5  1)(3  1)  8
  0.05
De acuerdo a la tabla tenemos que el valor es F 4,8, 0.05  3.84, así
que la regla de decisión es: rechazar H0 si el valor calculado de F
es mayor a 3.84.
Los datos necesarios para la tabla ANOVA se detallan a
continuación:
Suma de
Seco Normal Graso
bloques
7 9 12 28
11 12 14 37
13 11 8 32
8 9 7 24
9 10 13 32
x 48 51 54 153
x 2
484 527 622 1633
 x
2
153
2

SSTotal   x 2   1633   72.4


n 15
Análisis de la varianza 669

 Tc2    x 
2
482 512 542 1532
SST           3.6
 nc  n 5 5 5 15

 B2    x 
2

SSB    r  
 k  n
Donde Br se refiere al total de bloques, esto es, el total para la fila,
y k es el número de elementos en cada bloque, entonces:
 B2    x 
2

SSB    r  
 k  n
 282 37 2 322 242 322  1532
SSB         31.73
 3 3 3 3 3  15
Ahora encontremos el error de suma de cuadrados:
SSE  SS Total  SST  SSB  72.4  3.6  31.73
SSE  72.4  3.6  31.73  37.07
Los valores obtenidos los remplazamos en la tabla ANOVA:

TABLA ANOVA
Fuente de Suma de Grados de Cuadrado
F
variación cuadrados libertad medio

Tratamiento 3.6 2 1.8 0.39


Bloques 31.73 4 7.93 1.71
Error 37.07 8 4.63
Total 72.4

Dado que el valor 0.39 cae en la zona de aceptación se concluye


indicando que no existe diferencia significativa entre los
tratamientos, esto es entre los tipos de cabello. Asimismo, no
existe diferencia entre bloques dado que el valor F obtenido
(1.71) es menor al valor crítico 3.84. Es decir, no hay diferencia
significativa en el promedio de ventas por mes.
670 Estadística para Administración y Economía

EJERCICIOS RESUELTOS
1. El fabricante de una bebida baja en calorías está considerando la
importancia del color del envase (rojo, amarillo o azul) en las
ventas de la bebida. Para ello elige 16 tiendas más o menos del
mismo tamaño, y lleva envases rojos a seis de las tiendas, amarillos
a cinco y azules a los cinco restantes. Después de unos cuantos días,
se anotan las ventas (en decenas de envases) en las diferentes
tiendas, dándose los resultados que aparecen en la siguiente tabla:

ROJO AMARILLO AZUL


43 52 61
52 37 29
59 38 38
76 64 53
61 74 79
81
Con un nivel de significancia del 1% existe diferencia entre los
colores de los envases.
Solución
H0: 1 = 2 = 3
H1: Las ventas promedio no son todas iguales.
g.l. en el numerador = 2
g.l. en el denominador = 13
  0.01
Regla de decisión:

Z.
Z. Rechazo
rechazo

0.01
Z. aceptación
Z. Aceptación

F(2, 13, 0.01)6.7


F 2,13,0.01 6.7 FF(V1, V2 )
  V1 ,V2 

Rechazar H 0 si F  6.7.
Análisis de la varianza 671

ROJO AMARILLO AZUL TOTAL

xi xi2 xi xi2 xi xi2


43 1849 52 2704 61 3721
52 2704 37 1369 29 841
59 3481 38 1444 38 1444
76 5776 64 4096 53 2809
61 3721 74 5476 79 6241
81 6561
Tc 372 265 260 897
nc 6 5 5 16

x 2
24 092 15 089 15 056 54 237

 x
2
897 
2

SSTotal   x 2
  54 237   3948.938
n 16

 T 2   x
2
3722 2652 2602 897 2
SST    c        340.938
 nc  n 6 5 5 16
SSE  3948.938  340.938  3608

TABLA ANOVA
Fuente de Suma de Grados de Cuadrado
F
variación cuadrados libertad medio
Tratamiento 340.94 2 170.47
Error 3608 13 277.54 0.6142
Total 3948.94 15

De acuerdo a la tabla tenemos que el valor de prueba es 0.6142;


por lo tanto, se acepta H0, es decir, que no existe diferencia entre
los colores de los envases que mejoren las ventas.
2. Tres proveedores diferentes proporcionan piezas en lotes de 500.
para comparar la calidad de los lotes se toman muestras aleatorias
de seis lotes de cada proveedor y se examinan para determinar el
número de piezas no conformes. Los resultados se muestran en la
tabla. Contrastar la hipótesis correspondiente a un nivel de
significancia del 5%.
672 Estadística para Administración y Economía

PROVEEDOR A PROVEEDOR B PROVEEDOR C


28 22 33
37 27 29
34 29 39
29 20 33
31 18 37
33 30 38
Solución
H0: 1 = 2 = 3
H1: Las producciones promedio no son todas iguales.
g.l. en el numerador = 2; g.l en el denominador = 15
  0.05
Regla de decisión:

Z.Rechazo
Z. rechazo

0.05
Z.Z.aceptación
Aceptación

FF(2, 0.05) 3.68


 3.68 F(F
 2, 15,
15,0.05 V1,VV V)2 
1 ,2

Rechazar H 0 si F  3.68.
PROVEEDOR A PROVEEDOR B PROVEEDOR C TOTAL

xi xi2 xi xi2 xi xi2


28 784 22 484 33 1089
37 1369 27 729 29 841
34 1156 29 841 39 1521
29 841 20 400 33 1089
31 961 18 324 37 1369
33 1089 30 900 38 1444
Tc 192 146 209 547
nc 6 6 6 18

x 2
6200 3678 7353 17 231
Análisis de la varianza 673

 x
2
 547 
2

SSTotal   x 2
  17 231   608.28
n 18

 Tc2    x  1922 1462 2092 547 2


2

SST           354.11
 nc  n 6 6 6 18
SSE  608.28  354.11  254.17

TABLA ANOVA
Fuente de Suma de Grados de Cuadrado
F
variación cuadrados libertad medio
Tratamiento 354.11 2 177.05
10.449
Error 254.17 15 16.945
Total 608.28 17

De acuerdo a la tabla tenemos que el valor de prueba es 10.449;


por lo tanto, se rechaza H0; es decir, que existe diferencia en la
calidad de las piezas para los tres proveedores.
3. Una empresa está intentando decidir cuál de entre tres tipos de
autos consume menos, uno americano, uno japonés y otro europeo.
Para verlo, se toman muestras de tamaño cinco de cada tipo y a
cada auto se les hace recorrer 100 kilómetros y se anota el
consumo. Los resultados se muestran en la siguiente tabla.
Contrastar si existe diferencia de consumo entre los tres tipos de
autos, a un nivel de significancia del 1%.

AMERICANO JAPONÉS EUROPEO


18 20.1 19.3
17.6 15.6 17.4
15.4 16.1 15.1
19.1 15.3 18.6
16.9 15.4 16.1

Solución
H0: 1 = 2 = 3
H1: Las consumos promedio no son todos iguales.
g.l. en el numerador = 2
g.l. en el denominador = 12
  0.01
674 Estadística para Administración y Economía
Regla de decisión:

Z.
Z.Rechazo
rechazo

0.01
Z.aceptación
Z. Aceptación

F(2, 12, 0.01) 


F 2,12,0.01  6.93
6.93 F(FV1, V2 )
  V1 ,V2 

Rechazar H 0 si F  6.93.

AMERICANO JAPONÉS EUROPEO TOTAL

xi xi2 xi xi2 xi xi2


18 324 20.1 404.01 19.3 372.49
17.6 309.76 15.6 243.36 17.4 302.76
15.4 237.16 16.1 259.21 15.1 228.01
19.1 364.81 15.3 234.09 18.6 345.96
16.9 285.61 15.4 237.16 16.1 259.21
Tc 87 82.5 86.5 256
nc 5 5 5 15

x 2
1521.34 1377.83 1508.43 4407.6

 x
2
 256 
2

SSTotal   x 2
  4407.6   38.53
n 15

 Tc2    x 
2
87 2 82.52 86.52 2562
SST           2.43
 nc  n 5 5 5 15
SSE  38.53  2.43  36.1
Análisis de la varianza 675

TABLA ANOVA
Fuente de Suma de Grados de Cuadrado
F
variación cuadrados libertad medio
Tratamiento 2.4333 2 1.2167
0.4044
Error 36.1 12 3.0083
Total 38.5333 14

De acuerdo a la tabla tenemos que el valor es 0.4044; por lo tanto,


se acepta H0; es decir, que no existe diferencia de consumo entre
los tres autos.
4. Se anotan las calificaciones finales (puntaje sobre 100) de siete
estudiantes de primer año, de siete de segundo año y de siete de
tercer año. En la siguiente tabla se muestran los resultados. Probar
la hipótesis que la nota media de los estudiantes es la misma, aun
nivel de significancia del 5%.
PRIMERO SEGUNDO TERCERO
82 71 64
93 62 73
61 85 87
74 94 91
69 78 56
70 66 78
53 71 87
Solución
H0: 1 = 2 = 3
H1: Las calificaciones promedio no son todas iguales.
g.l. en el numerador = 2; g.l. en el denominador = 18

Z.
Z.Rechazo
rechazo

0.05
Z. aceptación
Z. Aceptación

F 2,F(2, 18, 0.05) 3.55


3.55 FF(VV1,,VV2)
 18,0.05  1 2
676 Estadística para Administración y Economía
Regla de decisión:
Rechazar H 0 si F  3.55.
PRIMERO SEGUNDO TERCERO TOTAL
2 2 2
xi x i
xi x i
xi x
i
82 6724 71 5041 64 4096
93 8649 62 3844 73 5329
61 3721 85 7225 87 7569
74 5476 94 8836 91 8281
69 4761 78 6084 56 3136
70 4900 66 4356 78 6084
53 2809 71 5041 87 7569
Tc 502 527 536 1565
nc 7 7 7 21

x 2
37 040 40 427 42 064 119 531

 x
2
1565
2

SSTotal   x 2
  119 531   2901.2381
n 21

 T 2   x
2
5022 527 2 5362 15652
SST    c        88.67
 nc  n 7 7 7 21
SSE  2901.2381  88.67  2812.57
TABLA ANOVA
Fuente de Suma de Grados de Cuadrado
variación cuadrados libertad medio F
Tratamiento 88.67 2 44.34
Error 2812.57 18 156.25 0.28378
Total 2901.2381 20

De acuerdo a la tabla tenemos que el valor de prueba es 0.28378;


por lo tanto, se acepta H0; es decir, que la nota media de los
estudiantes es la misma.
5. A una muestra de cuatro vendedores de cuatro regiones diferentes
se les pidió que dieran su opinión sobre cuál creían ellos iba a ser el
incremento porcentual de las ventas en sus regiones en el mes
siguiente. Las predicciones se muestran en la siguiente tabla. Utilice
nivel de significancia del 1% para probar si las predicciones en las
cuatro regiones son las mismas.
Análisis de la varianza 677

NORTE SUR ESTE OESTE


6.8 7.2 4.2 9.0
4.2 6.6 4.8 8.0
5.4 5.8 5.8 7.2
5.0 7.0 4.6 7.6
Solución
H 0 : 1  2  3  4
H1: Las predicciones promedio no son todas iguales.
g.l. en el numerador = 3; g.l. en el denominador = 12
  0.01
Regla de decisión:

Z.
Z. rechazo
Rechazo

0.01
Z.aceptación
Z. Aceptación

(3, 12, 0.01) 5.95


FF3,12,0.01 5.95 F(F
V1V, 1V,2V2)
 

Rechazar H 0 si F  5.95.
NORTE SUR ESTE OESTE TOTAL
2 2 2 2
xi x i
xi x i
xi x i
xi xi
6.8 46.24 7.2 51.84 4.2 17.64 9 81
4.2 17.64 6.6 43.56 4.8 23.04 8 64
5.4 29.16 5.8 33.64 5.8 33.64 7.2 51.84
5 25 7 49 4.6 21.16 7.6 57.76
Tc 21.4 26.6 19.4 31.8 99.2
nc 4 4 4 4 16

x 2
118.04 178.04 95.48 254.6 646.16

 x
2
 92.2 
2

SSTotal   x 2
  646.16  31.12
n 16
678 Estadística para Administración y Economía

 T 2   x
2
21.42 26.62 19.42
SST    c     
 nc  n 4 4 4
31.82 99.22
   23.24
4 16
SSE  31.12  23.24  7.88
TABLA ANOVA
Fuente de Suma de Grados de Cuadrado
F
variación cuadrados libertad medio
Tratamiento 23.24 3 7.7467
11.796
Error 7.88 12 0.6567
Total 31.12 15

De acuerdo a la tabla tenemos que el valor de prueba es 11.796;


por lo tanto, se rechaza H0; es decir, que existe diferencia entre el
incremento porcentual de las cuatro regiones.
6. Los gerentes en todos los niveles de una empresa necesitan
información adecuada para desempeñar sus funciones respectivas.
Un estudio investigó el efecto que la fuente tiene sobre la
propagación de la información. En ese estudio las fuentes de
información fueron: superior, igual y subordinada. En cada caso se
obtuvo una medida de propagación, en la que los valores mayores
indican mayor propagación de la información. Use  = 0.05 y los
datos adjuntos para probar si la fuente de información afecta
apreciablemente la propagación. ¿Cuál es su conclusión y qué
sugiere sobre el uso y propagación de la información?
Superior Igual Subordinada
8 6 6
5 6 5
4 7 7
6 5 4
6 3 3
7 4 5
5 7 7
5 6 5
Solución
H 0 : 1  2  3
H1: No todas las medias son iguales.
α = 0.05
Análisis de la varianza 679
g.l. en el numerador: k  1  3  1  2
g.l. en el denominador: n  k  24  3  21
Regla de decisión:

Z.
Z. Rechazo
rechazo

0.05
Z.
Z. Aceptación
aceptación

F 2,  3.47
21, 0.05) 3.47
F(2,21,0.05 FFV1 ,V2 
  (V1, V2 )

Rechazar H 0 si F  3.47.

Superior Igual Subordinada Total

xi xi2 xi xi2 xi xi2


8 64 6 36 6 36
5 25 6 36 5 25
4 16 7 49 7 49
6 36 5 25 4 16
6 36 3 9 3 9
7 49 4 16 5 25
5 25 7 49 7 49
5 25 6 36 5 25
Tc 46 44 42 132
nc 8 8 8 24

x 2
276 256 234 766

 x
2
132 
2

SSTotal   x 2
  766   40
n 24

 Tc2    x 
2
462 442 422 1322
SST          1
 nc  n 8 8 8 24
SSE  40  1  39
680 Estadística para Administración y Economía
TABLA ANOVA
Fuente de Suma de Grados de Cuadrado
F
variación cuadrados libertad medio
Tratamiento 1 2 0.5
0.269
Error 39 21 1.857
Total 40 23

De acuerdo al valor de prueba encontrado se acepta H0, es decir,


que no existe diferencia en las medias. La conclusión es que las
fuentes no tienen efecto sobre la propagación.
7. Los ejecutivos calificaron la calidad del servicio que ofrecen varios
ramos comerciales en Perú. Suponga que se obtuvieron las
siguientes calificaciones para los ramos de aerolíneas, ventas al
menudeo, hotelería y automóviles; los números mayores indican
más elevada calidad del servicio. Con nivel de significancia  = 0.05,
pruebe si hay alguna diferencia significativa entre las medias
poblacionales de las calificaciones de las cuatro industrias. ¿Cuál es
su conclusión?
Aerolíneas Menudeo Hotelería Automotriz
59 63 70 49
56 49 68 55
47 60 62 48
46 54 69 49
55 56 59 50
54 55
48
Solución
H 0 : 1  2  3  4
H1: No todas las medias son iguales.
α = 0.05
g.l. en el numerador: k  1  4  1  3
g.l. en el denominador: n  k  23  4  19
Regla de decisión:
Análisis de la varianza 681

Z. Rechazo
rechazo

0.05
Aceptación
Z. aceptación

FF(3,  3.13
19, 0.05) 3.13 F(VV11 ,,VV22)
3, 19,0.05 

Rechazar H 0 si F  3.13.
Aerolíneas Menudeo Hotelería Automotriz Total
2 2 2 2
xi xi
xi xi
xi x i
xi xi
59 3481 63 3969 70 4900 49 2401
56 3136 49 2401 68 4624 55 3025
47 2209 60 3600 62 3844 48 2304
46 2116 54 2916 69 4761 49 2401
55 3025 56 3136 59 3481 50 2500
54 2916 55 3025
48 2304
Tc 365 337 328 251 1281
nc 7 6 5 5 23

x 2
19 187 19 047 21 610 12 631 72 475

 x
2
1281
2

SSTotal   x 2
  72 475   1128.87
n 23

 Tc2    x 
2
3652 337 2 3282
SST        
 nc  n 7 6 5
2512 12812
   731.18
5 23
SSE  1128.87  731.18  397.69
682 Estadística para Administración y Economía

TABLA ANOVA
Fuente de Suma de Grados de Cuadrado
variación cuadrados libertad medio F
Tratamiento 731.18 3 243.73
Error 397.69 19 20.931 11.644
Total 1128.87 22

De acuerdo al valor de prueba encontrado se rechaza H0, es decir,


que la calificación promedio de la calidad de servicio es diferente
para cada uno de los ramos comerciales en el Perú.
8. De acuerdo con un artículo de una revista, las empresas
manufactureras más pequeñas tienen cada vez más dificultad para
recibir los pedidos de sus proveedores dentro de un tiempo
razonable. A medida que la economía se calienta y la capacidad de
producción se restringe, los pedidos tienden a retrasarse. Como
supervisor de producción de Manufactureras S.A., usted desea
probar el tiempo de entrega promedio, en días, para los pedidos que
usted hace con tres proveedores diferentes del componente del cojín
de lujo whoopie que fabrica su empresa. Aquí se presentan los
tiempos de entrega. A un nivel del 5%, ¿existe una diferencia en los
tiempos promedio?
Proveedor l: 5, 6, 6, 5, 6, 6, 7
Proveedor 2: 5, 4, 5, 5, 6, 5, 4
Proveedor 3: 4, 5, 2, 6, 5, 2, 4
Solución
H 0 : 1  2  3
H1: No todas las medias son iguales.

Z.
Z. Rechazo
rechazo

0.05
Z.aceptación
Z. Aceptación

FF
 18, 0.05) 3.55
2,(2,18,0.05
3.55 F(VV11, VV22)
Análisis de la varianza 683
g.l. en el numerador: k  1  3  1  2
g.l. en el denominador: n  k  21  3  18
Regla de decisión:
Rechazar H 0 si F  3.55.
Prov_1 Prov_2 Prov_3 Total
2 2 2
xi xi
xi x i
xi xi
5 25 5 25 4 16
6 36 4 16 5 25
6 36 5 25 2 4
5 25 5 25 6 36
6 36 6 36 5 25
6 36 5 25 2 4
7 49 4 16 4 16
Tc 41 34 28 103
nc 7 7 7 21

x 2
243 168 126 537

 x
2
103
2

SSTotal   x 2
  537   31.81
n 21

 T 2   x
2
412 342 282 1032
SST    c        12.095
 nc  n 7 7 7 21
SSE  31.81  12.095  19.715
TABLA ANOVA
Fuente de Suma de Grados de Cuadrado
F
variación cuadrados libertad medio
Tratamiento 12.095 2 6.0475
5.521
Error 19.715 18 1.0953
Total 31.81 20

De acuerdo al valor de prueba se rechaza H0, es decir, que existe


diferencia entre los promedios de los tiempos de los proveedores.
9. Una discusión en Piura Agricultores llamó la atención sobre el
efecto de diferentes suplementos alimenticios en grano en las tasas
de crecimiento de los pollos criados comercialmente. En Pollería
Miguel, se practicó una prueba en la cual l8 pollos se dividieron de
684 Estadística para Administración y Economía
forma homogénea en tres grupos, y cada grupo era alimentado con
un suplemento en particular. Los incrementos en crecimiento
durante un período de seis semanas, medidas en libras, aparecen en
la siguiente tabla. A un nivel del 5%, ¿parece haber evidencia en la
tasa de crecimiento promedio de los pollos de acuerdo al
suplemento utilizado?
Suplemento
A B C
2.2 3.7 3.8
2.4 2.1 4.1
2.7 3.2 3.9
3.8 2.9 2.7
3.2 3.9 4.1
3.9 3.8 3.2
Solución
H 0 : 1  2  3
H1: No todas las medias son iguales.
  0.05
g.l. en el numerador: k – 1 = 3 – 1 = 2
g.l. en el denominador: n – k = 18 – 3 = 15
Regla de decisión:

Z.
Z. Rechazo
rechazo

0.05
Z.
Z. aceptación
Aceptación

FF2,  3.68
15, 0.05) 3.68 F(VV11, VV22)
(2,15,0.05
Análisis de la varianza 685
Rechazar H 0 si F  3.68.
Sup_A Sup_B Sup_C Total
2 2 2
xi xi
xi x i
xi x i
2.2 4.84 3.7 13.69 3.8 14.44
2.4 5.76 2.1 4.41 4.1 16.81
2.7 7.29 3.2 10.24 3.9 15.21
3.8 14.44 2.9 8.41 2.7 7.29
3.2 10.24 3.9 15.21 4.1 16.81
3.9 15.21 3.8 14.44 3.2 10.24
Tc 18.2 19.6 21.8 59.6
nc 6 6 6 18

x 2
57.78 66.4 80.8 204.98

 x
2
 59.6 
2

SSTotal   x 2
  204.98   7.638
n 18

 T 2    x  18.22 19.62 21.82 59.62


2

SST    c        1.098
 nc  n 6 6 6 18
SSE  7.638  1.098  6.54
TABLA ANOVA
Fuente de Suma de Grados de Cuadrado
F
variación cuadrados libertad medio
Tratamiento 1.098 2 0.549
1.259
Error 6.54 15 0.436
Total 7.638 17

De acuerdo al valor de prueba se acepta H0, es decir, que Pollería


Miguel puede usar cualquier suplemento, ya que no hay
diferencias significativas entre ellos.
10. El diario El Tiempo imprimió una historia sobre el uso de detectives
privados para efectos de descubrir algunos hechos que pudieran
hacer que la empresa fuera menos deseable desde el punto de vista
de una fusión por adquisición. "M & A", una empresa de detectives
con sede en Lima "da cuenta de por lo menos el 20% de los $50
millones que M & A debería percibir este año". Petroquímicos,
Banca, Computadores y Electrónica son industrias especialmente
fértiles para M & A. Se asume que seis empresas de cada industria
686 Estadística para Administración y Economía
se investigan aleatoriamente mediante encuestas para determinar los
montos involucrados en las propuestas de adquisición, y los
resultados aparecen a continuación. ¿Podría concluirse, al nivel del
5% que existe alguna diferencia en las propuestas promedio entre
estas industrias? Los valores están en millones de dólares.
Licitación Petroquímicos Banca Computadores Electrónica
1 919.3 842.7 647.3 743.7
2 874.2 1144.7 873.2 747.3
3 832.7 942.3 714.4 812.5
4 732.9 747.1 652.8 643.7
5 893.2 812.7 855.6 682.1
6 1321.4 855.6 642.1 632.1
Solución
H 0 : 1  2  3
H1: No todas las medias son iguales.
  0.05
g.l. en el numerador: k  1  4  1  3
g.l. en el denominador: n  k  24  4  20
Regla de decisión:

Z.
Z.Rechazo
rechazo

0.05
Z.aceptación
Z. Aceptación

F(3,3,20,
F  3.1
0.05)  3.1 FF(V1V,1V,V22)
 20,0.05 

Rechazar H 0 si F  3.1.
Análisis de la varianza 687

 x
2
19 565.6 
2

SSTotal   x 2
  16 556 074   605 544.69
n 24
688 Estadística para Administración y Economía

 T 2   x
2
5573.7 2 5345.12 4385.42
SST    c     
 nc  n 6 6 6
4261.42 19 565.62
   220 718.83
6 24
SSE  605 544.69  220 718.83  384 825.86

TABLA ANOVA
Fuente de Suma de Grados de Cuadrado
F
variación cuadrados libertad medio
Tratamiento 220 718.83 3 73 572.94
3.8237
Error 384 825.86 20 19 241.29
Total 605 544.69 23

De acuerdo al valor de prueba encontrado se rechaza H0, es decir,


que existe diferencia en la respuesta promedio de las industrias.
Análisis de la varianza 689
PROBLEMAS PROPUESTOS
1. Están considerándose seis diferentes máquinas para su uso en la
manufactura de sellos de goma. Estas están siendo comparadas con
respecto a la resistencia de tensión del producto. Se utiliza una
muestra aleatoria de 4 sellos de cada máquina para determinar si la
resistencia promedio a la tensión varía de máquina a máquina o no.
Las siguientes son las mediciones de resistencia a la tensión en
kilogramos por centímetro cuadrado por 101 :
Máquina
1 2 3 4 5 6
17.5 16.4 20.3 14.6 17.5 18.3
16.9 19.2 15.7 16.7 19.2 16.2
15.8 17.7 17.8 20.8 16.5 17.5
18.6 15.4 18.9 18.9 20.5 20.1
Realice el análisis de varianza a nivel de significancia de 0.05, e
indique si las resistencias promedio a la tensión difieren o no
significativamente para las 6 máquinas.
2. Los datos de la tabla siguiente representan el número de horas de
descanso proporcionadas por 5 diferentes marcas de tabletas para el
dolor de cabeza administradas a 25 sujetos que experimentaban
fiebres de 38 °C o más. Lleve a cabo el análisis varianza y pruebe la
hipótesis, a nivel de significancia de 0.05, de que el número
promedio de horas de descanso proporcionadas por las tabletas es el
mismo para las 5 marcas.
Tableta
A B C D E
5 9 3 2 7
4 7 5 3 6
8 8 2 4 9
6 6 3 1 4
3 9 7 4 7
3. En un artículo publicado en el diario el Comercio.com, se investiga
el efecto de la altura de los estantes en los supermercados sobre las
ventas de los alimentos enlatados para perro. Se llevó a cabo un
experimento en un pequeño supermercado durante un periodo de 8
días sobre las ventas de una sola marca de alimento para perros, al
que se le llamará, para referencia, alimento para perros Arf y en el
cual se utilizaron tres niveles diferentes de estante: a la rodilla, a la
cintura, y a los ojos. Durante cada uno de los días donde se tenía el
690 Estadística para Administración y Economía
alimento para perros se cambió aleatoriamente en tres diferentes
ocasiones. Las secciones restantes de la góndola que contenían la
marca determinada se llenó con una mezcla de marcas de alimento
para perros que eran familiares y no familiares para los clientes en
esta área geográfica en particular. Las ventas, en cientos de dólares,
del alimento para perros marca Arf durante cada día para las tres
alturas de estante son las de la tabla siguiente:

Nivel de la Nivel de la Nivel de


rodilla cintura los ojos
77 88 85
82 94 85
86 93 87
78 90 81
81 91 80
86 94 79
77 90 87
81 87 93
¿Existe una diferencia significativa en las ventas promedio diarias
de este alimento para perros de acuerdo con la altura del estante?
Utilice un nivel de significancia de 0.01.
4. Tres profesores enseñan a tres secciones del mismo curso de
Matemáticas. Las calificaciones se registran de la siguiente manera:

Profesor
A B C
73 88 68
89 78 79
82 48 56
43 91 91
80 51 71
73 85 71
66 74 87
60 77 41
45 31 59
93 78 68
36 62 53
77 76 79
96 15
80
56
Análisis de la varianza 691
¿Existe una diferencia significativa en las calificaciones promedio
obtenidas con los tres profesores?
Utilice un nivel de significancia de 0.05.
5. Los siguientes datos representan las calificaciones finales obtenidas
por 5 alumnos de la Facultad de Ciencias Económicas y
Empresariales de la UDEP en Matemática Básica I, Matemática
Básica II, Matemáticas Empresariales, Estadística e Investigación
de Operaciones.
Cursos
Investigación
Matemática Matemática Matemáticas
Alumnos Estadística de
Básica I Básica II Empresariales
Operaciones
Juan 14 13 14 16 18
Pedro 13 18 15 19 12
María 11 16 13 18 14
Claudia 12 15 12 16 17
Oscar 12 14 16 13 19

El Secretario Académico afirma que los cursos tienen el mismo


grado de dificultad, mientras que el director del programa de
Administración de Empresas afirma que los estudiantes tienen el
mismo rendimiento académico; para probar la validez de estas
afirmaciones se pide:
a) Plantee textualmente las pruebas de hipótesis apropiadas para
ambos casos.
b) Pruebe la afirmación del director del programa de Admi-
nistración de Empresas.
Use un nivel de significación de 0.05.
6. Una muestra al azar de 6 sujetos lee 1, 3 y 5 veces una lista de 50
palabras que deben memorizar. Tras cada lectura se les pasa una
tarea de recuerdo. Sus resultados (o aciertos) fueron:
1 lectura 15 17 14 18 18 16
3 lecturas 21 25 22 24 29 27
5 lecturas 28 32 34 35 30 30
a) ¿Incrementa el número de lecturas el recuerdo?
b) ¿Dónde se dan los mejores y peores resultados?
7. Se pretende comparar los salarios de los trabajadores de una cadena
de supermercados con sucursales en diferentes ciudades. Se eligen 5
692 Estadística para Administración y Economía
localidades al azar y se toma una muestra en cada una de 9 personas.
Se obtienen los siguientes datos:
Tienda 1 Tienda 2 Tienda 3 Tienda 4 Tienda 5
180 240 240 300 300
240 360 270 240 360
300 180 300 300 240
360 180 360 360 360
240 300 360 360 360
180 240 300 360 360
144 360 360 360 360
300 360 360 360 300
240 360 300 300 360

¿Tienen los trabajadores de las 5 tiendas el mismo sueldo medio?


8. Comparamos 4 tratamientos clínicos (A, B, C, D) asignando al azar
15 sujetos a los mismos. Las puntuaciones de los sujetos en la VD
(un cuestionario de escala de 0 a 150 puntos) fueron:
A 42 0 63
B 45 64 33 29
C 44 82 64 74
D 109 120 116 97
a) Compare si las medias de los 4 grupos son similares.
b) ¿Cuál es el grupo que rinde mejor? ¿Y el peor?
9. En una investigación sobre adquisición de conceptos un psicólogo
ha creado tres tipos diferentes de estímulos: ejemplares prototípicos
de la categoría que representan, ejemplares corrientes y ejemplares
atípicos. Aplica cada conjunto de estímulos a un grupo de sujetos y
evalúa el número de elementos recordados al cabo de media hora.
Los resultados son los siguientes:
FV SC g.l. MC F
Íntergrupos 12.5 1.042
Error
Total 349
a) Complete la tabla.
b) ¿Puede concluirse que el tipo de estímulo influye en el
recuerdo con α = 0.01?
10. En un estudio sobre memoria registramos el número de aciertos de 6
sujetos en condiciones de reconocimiento (A1) y de recuerdo (A2) en
tres periodos temporales distintos (B1: tras una hora desde la fase de
estudio; B2: tras un día; B3: tras una semana). Los resultados fueron:
Análisis de la varianza 693

B1 B2 B3
4 5 7
6 8 10
1 6 5
A1
2 10 12
5 10 10
1 7 8
1 2 4
3 6 6
3 5 4
A2
1 4 7
5 6 5
2 8 7

Analice e interprete los resultados.


11. Para verificar si la memoria cambia con la edad se ha realizado un
experimento con cuatro grupos de seis sujetos cada uno. Los grupos
difieren en la edad de los sujetos. Se muestra a cada sujeto una
serie de sílabas sin sentido y a continuación se les pide que
escriban todas las que puedan recordar. La siguiente tabla
contiene el número de sílabas recordadas correctamente. Realice el
contraste con   0.05 .
30 años 40 años 50 años 60 años
14 12 17 13
13 15 14 10
15 16 14 7
17 11 9 8
12 12 13 6
10 18 15 9

12. En una empresa alimenticia se está desarrollando un nuevo cereal


para el desayuno. Se han obtenido tres variedades del mismo (A, B
y C) con el objetivo de comercializar la que produzca mayor
satisfacción. A una muestra de 6 personas se le da a probar cada
variedad en tres días consecutivos y se anota el grado de
satisfacción que ha experimentado con cada cereal. ¿Puede
concluirse que las tres variedades son equivalentes utilizando
  0.01?
694 Estadística para Administración y Economía

A B C
1 7 5
4 5 4
3 3 4
3 6 5
2 4 7
5 7 8

13. Un investigador realiza un experimento para determinar si la


ingestión de alcohol afecta a la atención auditiva. Se seleccionan 18
sujetos a los que divide en tres grupos y les administra diferente
dosis de alcohol. A continuación reciben una prueba de audición
consistente en la presentación de sonidos de diferente longitud. El
sujeto tiene que identificar aquellos sonidos que tienen una
duración específica. La siguiente tabla contiene el número de
identificaciones correctas.
Baja Media Alta
85 60 60
83 58 48
76 76 38
64 52 47
75 63 50
81 49
78

Contraste si hay efecto con α = 0.01.


14. Un psicólogo jurídico está investigando el efecto del tipo de delito
sobre la memoria de los testigos. Toma una muestra de cuatro
sujetos y les presenta cuatro películas diferentes en las que se
comete un delito de amenazas, robo, agresión y secuestro. A
continuación evalúa el número de detalles que son capaces de
recordar en cada caso. Contraste si el delito afecta al recuerdo con
  0.05 .

Amenazas 52 57 55 59
Robo 46 52 51 50
Agresión 44 53 50 51
Secuestro 42 39 44 41

15. Un psicólogo de la personalidad desea saber si las puntuaciones


medias en tres escalas del MMPI (hipocondría, depresión, histeria)
son iguales en una determinada población. Para ello aplica el test a
una muestra aleatoria de 50 personas procedente de dicha
Análisis de la varianza 695
población. Complete la siguiente tabla de datos y obtenga una
conclusión con   0.01.
FV SC g.l. MC F
Íntergrupos 8.92
Error 32.4
Total 26.85

16. Se está realizando una investigación para determinar el efecto de un


medicamento sobre la atención de los conductores. Se ha creado
cuatro grupos de cuatro sujetos cada uno cruzando dos variables:
experiencia en conducir (poca, mucha) y dosis administrada
(placebo, medicamento). A continuación se aplica una prueba de
atención. Decida si hay efectos con   0.05 .
Placebo Medicamento
45 30
48 33
Poca
62 48
Experiencia

70 50
47 52
48 60
Mucha
52 58
58 62

17. Demostrar que el cuadrado medio del error:


SSE
MSE 
n  k 
para el análisis de varianza en la clasificación en una sola dirección,
es una estimación insesgada de  2 .
18. Se está realizando una investigación sobre las donaciones
económicas a organizaciones no gubernamentales. En concreto, se
está estudiando el efecto del medio (rural, semiurbano, urbano) y
del nivel de ingresos económicos (bajo, medio, alto). Los resultados
se resumen en la tabla:
FV SC g.l. MC F
Factor A
Factor B 30
Interacción 2.5 10.4
Error
Total 280 53
696 Estadística para Administración y Economía
a) Complete la tabla de ANOVA.
b) ¿Cuántos sujetos hay en cada casilla?
c) ¿Qué efectos se han encontrado?
Análisis de la varianza 697
APLICACIONES EN EXCEL
Análisis de la varianza mediante herramientas de análisis en Excel.
Análisis de la varianza de un factor
En Excel es posible realizar un análisis simple de varianza para
comprobar la hipótesis según la cual dos o más muestras, extraídas de
poblaciones con la misma media, son iguales. Si en el cuadro de
diálogo Análisis de datos elegimos Análisis de varianza de un factor,
se obtiene el cuadro de diálogo de la siguiente figura:

En el cuadro Rango de entrada introduzca la referencia de celda


correspondiente al rango de datos que desee analizar. La referencia
deberá contener dos o más rangos adyacentes organizados en columnas
o filas. En el campo Agrupado por haga clic en el botón Filas o
Columnas para indicar si los datos del rango de entrada están
organizados en filas o en columnas. Si la primera fila del rango de
entrada contiene rótulos, active la casilla de verificación Rótulos en la
primera fila. Si los rótulos están en la primera columna del rango de
entrada, active la casilla de verificación Rótulos en la primera
columna. Esta casilla de verificación estará desactivada si el rango de
entrada carece de rótulos; Microsoft Excel generará los rótulos de
datos correspondientes para la tabla de resultados. Introduzca el nivel
con el que desee evaluar los valores críticos de la función estadística F.
El nivel Alfa es un nivel de importancia relacionado con la
probabilidad de que haya un error de tipo I (rechazar una hipótesis
verdadera).
En cuanto a las Opciones de salida, en el campo Rango de
salida introduzca la referencia correspondiente a la celda superior
698 Estadística para Administración y Economía
izquierda de la tabla de resultados. Haga clic en la opción En una hoja
nueva para insertar una hoja nueva en el libro actual y pegar los
resultados, comenzando por la celda Al de la nueva hoja de cálculo.
Para darle un nombre a la nueva hoja de cálculo, escríbalo en el cuadro.
Haga clic en la opción En un libro nuevo para crear un nuevo libro y
pegar los resultados en una hoja nueva del libro creado.
Ejercicio 1
Del archivo Data, determine si existe diferencia significativa en los
coeficientes intelectuales de las personas de las diferentes regiones.
Solución
 Ordene la data según Región del encuestado, luego seleccione los
coeficientes intelectuales de cada Región y cópielos en una hoja
nueva.

 Seleccione Herramientas y luego Análisis de datos.


 En la ventana Análisis de datos elegir Análisis de varianza de
un factor.
 En Rango de entrada ingresar A1:D45.
 En Agrupado por seleccionar Columnas.
Análisis de la varianza 699
 Activar la casilla Rótulos en la primera fila.
 En Rango de salida indicar la celda F2.

 Al dar Aceptar en la ventana anterior se obtiene la siguiente tabla:

 Dado que el valor p es 0.8505, mayor al nivel de significancia, se


concluye indicando que no existe diferencia significativa en los
coeficientes intelectuales de las personas ubicadas en las
diferentes regiones. En otras palabras, el coeficiente intelectual es
independiente de la ubicación geográfica del individuo.
700 Estadística para Administración y Economía
Análisis de la varianza de dos factores con una sola muestra por
grupo
Esta herramienta de análisis realiza un análisis de varianza de dos
factores con una sola muestra por grupo, comprobando la hipótesis
según la cual las medias de dos o más muestras son iguales, extraídas
de poblaciones con la misma media. Si en el cuadro de Análisis de
datos elegimos Análisis de varianza de dos factores con una sola
muestra por grupo, se obtiene el siguiente cuadro de diálogo:

En el cuadro Rango de entrada introduzca la referencia de


celda correspondiente al rango de datos que desee analizar. La
referencia deberá contener dos o más rangos adyacentes organizados en
columnas o filas. La casilla Rótulos estará desactivada si el rango de
entrada carece de rótulos; Microsoft Excel generará los rótulos de datos
correspondientes para la tabla de resultados. El nivel Alfa es un nivel
de importancia relacionado con la probabilidad de que haya un error de
tipo I (rechazar una hipótesis verdadera).
En cuanto a las Opciones de salida, en el campo Rango de
salida introduzca la referencia correspondiente a la celda superior
izquierda de la tabla de resultados. Haga clic en la opción En una hoja
nueva para insertar una hoja nueva en el libro actual y pegar los
resultados, comenzando por la celda Al de la nueva hoja de cálculo.
Para darle un nombre a la nueva hoja de cálculo, escríbalo en el cuadro.
Haga clic en la opción En un libro nuevo para crear un nuevo libro y
pegar los resultados en una hoja nueva del libro creado.
Ejercicio 2
Para estudiar las diferencias entre cuatro fertilizantes en relación con la
producción de papas, se dispuso de cinco fincas, cada una de las cuales
se dividió en cuatro parcelas del mismo tamaño y tipo. Los fertilizantes
Análisis de la varianza 701
fueron asignados al azar en las parcelas de cada finca. El rendimiento
en toneladas, fue:
Fertilizantes
F1 F2 F3 F4
P1 2,1 2,2 1,8 2,1
P2 2,2 2,6 1,9 2,0
Parcelas
P3 1,8 2,7 1,6 2,2
P4 2,0 2,5 2,0 2,4
P5 1,9 2,8 1,9 2,1
Se desea saber si existen diferencias entre los fertilizantes y entre las
fincas, independientemente del fertilizante.
Solución
 Comenzamos introduciendo los datos en una hoja de cálculo
Excel, tal como se indica en la siguiente figura:

 Para ajustar los datos a un modelo del análisis de varianza,


consideremos como variable respuesta el rendimiento y como
factores las fincas y fertilizante, sin interacción. Por lo tanto,
utilizaremos la opción Análisis de la varianza de dos factores
con una sola muestra por grupo.
 Activar el cuadro Análisis de datos y elegir Análisis de la
varianza de dos factores con una sola muestra por grupo y dar
Aceptar.
702 Estadística para Administración y Economía
 En Rango de entrada indicar las celdas A2:E7.
 Active la casilla Rótulos.
 En Rango de salida indicar la celda B10.

 Al pulsar Aceptar en la ventana anterior tenemos lo siguiente:

 El valor p para las filas, fincas, es 0.6395 mayor al nivel de


significancia adoptado, se concluye indicando que no existe
diferencia significativa entre las fincas. Sin embargo, con
respecto a los fertilizantes sí existe diferencia significativa dado
que el valor p, (0.0003), es menor al nivel de significancia.
Análisis de la varianza 703
Análisis de la varianza de dos factores con varias muestras por
grupo
En Excel se puede extender el análisis de la varianza de un factor al
caso en el que exista más de una muestra por cada grupo de datos. Si en
el cuadro de diálogo Análisis de datos elegimos Análisis de la
varianza de dos factores con varias muestras por grupo, se obtiene
el siguiente cuadro de diálogo:

En el cuadro Rango de entrada introduzca la referencia de celda


correspondiente al rango de datos que desee analizar. La referencia
deberá contener dos o más rangos adyacentes organizados en columnas
o filas. En el cuadro Fila por muestra introduzca el número de filas
que contiene cada muestra. Todas las muestras deben contener el
mismo número de filas, ya que cada fila representa una réplica de los
datos. El nivel Alfa es un nivel de importancia relacionado con la
probabilidad de que haya un error de tipo I (rechazar una hipótesis
verdadera).
En cuanto a las Opciones de salida, en el campo Rango de
salida introduzca la referencia correspondiente a la celda superior
izquierda de la tabla de resultados. Haga clic en la opción En una hoja
nueva para insertar una hoja nueva en el libro actual y pegar los
resultados, comenzando por la celda Al de la nueva hoja de cálculo.
Para darle un nombre a la nueva hoja de cálculo, escríbalo en el cuadro.
Haga clic en la opción En un libro nuevo para crear un nuevo libro y
pegar los resultados en una hoja nueva del libro creado.
704 Estadística para Administración y Economía
Ejercicio 3
En una investigación sobre el efecto que un determinado fármaco tiene
en los niveles de glucemia, se seleccionaron 5 pacientes de
características muy similares, a los que se les midió la glucemia en
estado basal (a los 0’), a los 15’ y a los 30’ de aplicar la medición,
combinando la administración de un placebo (0 mg), y dos dosis de
5 mg y 10 mg del fármaco. Los datos obtenidos fueron los siguientes:
Tiempos Dosis
0 mg 5 mg 10 mg
82 86 108
83 87 109
0’
85 90 112
75 80 89
81 83 103

88 90 110
87 91 110
15’ 91 94 117
79 83 90
85 88 109

83 96 118
85 97 120
30’ 85 99 125
79 88 119
81 93 114
Estudiar si existe variabilidad entre las dosis y entre los tiempos, y si es
significativa la interacción. ¿Cuál es la principal causa de variabilidad?
Solución
 Comenzamos introduciendo los datos en una hoja de cálculo
Excel, tal como se indica en la siguiente figura:
Análisis de la varianza 705

 Tenemos como causas de la variabilidad de la variable respuesta


nivel de glucemia, los factores tiempo y dosis. Pero como hay
una replicación de cinco individuos, entonces estamos frente a un
diseño de dos factores con varias muestras por grupo.
 Activar Análisis de datos y luego elegir la opción Análisis de la
varianza de dos factores con varias muestras por grupo.

 En Rango de entrada indicar las celdas A2:D17.


 En Fila por muestra escriba 5.
 En Rango de salida indicar la celda F2.
706 Estadística para Administración y Economía

 Al pulsar Aceptar en la ventana anterior, tenemos lo siguiente:

 A la luz de los valores p obtenidos, se concluye que son


significativos los factores tiempo y dosis y la interacción a un
95%. La principal causa de variabilidad es el factor dosis, puesto
que es el que tiene el menor valor p, 0,000000000, y los mayores
cuadrados medios y sumas de cuadrados.

También podría gustarte