Analisis de Varianza y Tukey 1am1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 35

Análisis de

varianza
´ El análisis de varianza (ANOVA) es uno de
los análisis estadísticos más comunes en
investigación. Tiene varios usos, pero uno
Análisis de de los más comunes es para probar la
varianza hipótesis de que las medias de tres o mas
grupos son iguales o no.
Hipótesis:

H0: µ1 = µ2 = µ3 = µ4 …= µk

Análisis de
varianza

Ha : Al menos una µ es
diferente
3 Poblaciones, c/u tiene su propia µ y se
asume distribución Normal y varianzas
iguales (homoscedasticidad)

Media 1 Media 2 Media 3


¿Hay diferencia entre las medias de las
tres poblaciones?

Ho: µ1 =µ2 = µ3
Ha: al menos una µ es diferente
Las tres muestras pueden tener medias muy
cercanas entre sí y mucha varianza

Media 1 Media 2 Media 3


O pueden tener medias muy lejanas
entre sí, y poca varianza interna

Media 1 Media 2 Media 3


Si la varianza interna de cada población es
mayor que la varianza entre los grupos, lo
mas probable es que las µ sean iguales.
No se rechaza H0
Media 1 Media 2 Media 3
Si varianza entre grupos > la varianza
interna de cada población es más
probable que las medias µ sean diferentes.
Se rechaza H0

Media 1 Media 2 Media 3


Diseño completamente aleatorizado
con un solo factor
´ Asignación aleatoria de los tratamientos a las unidades
experimentales
´ Aleatorización del orden de preparación de los
tratamientos
´ Aleatorización de la ubicación en el laboratorio
Diseño completamente aleatorizado

Se realizó un experimento para determinar el efecto de la


nutrición sobre los intervalos de atención de estudiantes de
escuelas primarias. De un grupo de 15 estudiantes, se asignaron
al azar 5 a cada uno de tres planes de comidas: Sin desayunar,
desayuno ligero y desayuno completo. Sus intervalos de atención
(en minutos) se registraron durante un periodo de lectura por la
mañana y se muestran en la tabla. Realice el análisis de varianza
para este experimento. A un nivel de significancia de 0.05, hubo
efecto de la nutrición sobre los intervalos de atención?
Factor: Desayuno
Niveles: 3
Tratamientos: 3
Réplicas en cada tratamiento: 5
Variable de respuesta: intervalo de atención a la lectura

No desayuno Desayuno ligero Desayuno completo

8 14 10
7 16 12
9 12 16

13 17 15
10 11 12
´Variación total = variación entre grupos +
variación residual (variación interna)

No desayuno Desayuno ligero Desayuno completo

8 14 10
7 16 12
9 12 16

13 17 15
10 11 12
A un nivel de significancia 0.05,¿Son
iguales las medias o al menos una
media es diferente?
H0: µ1 = µ2 = µ3
Ha: al menos una µ es diferente a otra
No desayuno Desayuno ligero Desayuno completo

8 14 10
7 16 12
9 12 16

13 17 15
10 11 12
∑ 𝑥 − 𝑥̅ 2
𝑠2 =
𝑛−1
Media
Varianza total

Varianza

Media 1 Media 2 Media 3


Varianza entre grupos
Varianza entre grupos Varianza intragrupo
Sin Desayuno Desayuno
desayuno ligero completo
Variabilidad total 8 14 10
7 16 12
Suma de Cuadrados Total
∑𝑥 " 9 12 16
"
𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = * 𝑥! –
𝑁 13 17 15

#$" ! 10 11 12
𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 2338 -
#%
∑ 𝑥 =47 ∑ 𝑥 =70 ∑ 𝑥 =65
𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 129.73 ∑ 𝑥! " =1006 ∑ 𝑥! " = 869
$ 𝑥! " = 463

media=9.4

∑ 𝑥 =182
∑ 𝑥! " =2338
Tabla de Análisis de Varianza o
Tabla de ANOVA
grados
Fuente de
variación
Suma de Cuadrados
(SC)
de
Cuadrado
Medio
F
libertad

∑ 𝑔𝑟𝑢𝑝𝑜𝑗 " ∑ 𝑥! "


Grupos ) −
𝑛# 𝑁

Residual
o Error

Total 129.73
Se puede calcular la varianza entre los
grupos: que tan lejos está cada media de
la media total
MEDIA TOTAL
Varianza total
Varianza entre grupos

Varianza
Variación entre los grupos
Sin Desayuno Desayuno
desayuno ligero completo
8 14 10
7 16 12
9 12 16
13 17 15
10 11 12
∑ 𝑥 =47 ∑ 𝑥 =70 ∑ 𝑥 =65

∑ 𝑔𝑟𝑢𝑝𝑜1 " ∑ 𝑔𝑟𝑢𝑝𝑜2 " ∑ 𝑔𝑟𝑢𝑝𝑜 3 " ∑ 𝑥! "


𝑆𝐶𝐺𝑟𝑢𝑝𝑜𝑠 = + + −
𝑛# 𝑛" 𝑛$ 𝑁𝑡𝑜𝑡𝑎𝑙
%& ! &( ! )' ! #*" !
𝑆𝐶𝐺𝑟𝑢𝑝𝑜𝑠 = '
+ '
+ '
− #'

𝑆𝐶𝐺𝑟𝑢𝑝𝑜𝑠 = 58.53
Tabla de Análisis de Varianza o
Tabla de ANOVA
Fuente Suma de Cuadrados G.L. Cuadrado F
de (SC) Medio (CM)
variación

Grupos 58.53

Residual 71.2

Total 129.73 - -
Suma de Cuadrados Residual
Mide la variabilidad entre elementos
de cada grupo, también se le llama S.C. del error
Se puede calcular por diferencia:

SCTotal = S.C. Grupos + S.C. Residual


´𝑆𝐶𝑇𝑜𝑡𝑎𝑙 − 𝑆𝐶𝐺𝑟𝑢𝑝𝑜𝑠 = 𝑆𝐶 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙
´𝑆𝐶 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙 =129.73 - 58.53 = 71.2
Tabla de Análisis de Varianza o
Tabla de ANOVA k= número de grupos
N= número total de datos
Fuente de Suma de Grados de Cuadrado F
variación Cuadrados libertad Medio
(SC) (CM)
k -1= 𝑆𝐶 𝑔𝑟𝑢𝑝𝑜𝑠
Grupos 58.53
3 -1=2 𝑔. 𝑙. 𝑔𝑟𝑢𝑝𝑜𝑠

Residual o 𝑆𝐶 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙
71.2 N-k =12
del Error 𝑔. 𝑙. 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙

N-1=
Total 129.73
15-1=14
Tabla de Análisis de Varianza
Cuadrado Medio grupos ~ Varianza entre grupos

Fuente de Suma de Grados de Cuadrado F F crítico


variación Cuadrados libertad Medio (CM)
(SC)
$%.$' "(.")
Grupos 58.53 2 =29.26 $.('
=4.93 3.8853
"

Residual o *+."
= 5.93
71.2 12
del Error +"

Total 129.73 14 /
𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑀𝑒𝑑𝑖𝑜 𝑑𝑒 𝑔𝑟𝑢𝑝𝑜𝑠
𝐹=
𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑀𝑒𝑑𝑖𝑜 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙
F crítico = F 𝛂 , g.l. grupos, gl residual

Si Fcalculado > Fcrítico se rechaza la H0


4.93 > 3.88, por lo tanto se rechaza H0
Conclusión: al menos una µ es diferente
g. l. Grupos =
g. l. Residual
Tabla de Análisis de Varianza o
Tabla de ANOVA
Fuente Suma de Cuadrados G.L. Cuadrado F
de (SC) Medio (CM)
variación
∑ 𝑔𝑟𝑢𝑝𝑜𝑗 " ∑ 𝑥! " 𝑆𝐶𝐺𝑟𝑢𝑝𝑜𝑠 𝐶𝑀𝐺𝑟𝑢𝑝𝑜𝑠
Grupos ) − k-1
𝑛# 𝑁 𝑘−1 𝐶𝑀𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙
-
𝑆𝐶𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙
Residual ) 𝑛! − 1 𝑠!" N- k -
𝑁−𝑘
!,+

∑𝑥 "
"
Total ) 𝑥! – N-1 - -
𝑁
¿Cuáles medias son diferentes entre
sí? Prueba de Tukey
Prueba para comparación Múltiple de medias
H0 : µi = µj
Ha : µi ≠ µj
´ Se calcula DHS (Diferencia Honesta significativa)
ABCDE!FGHI
´ DHS = q
J∗

´ Se obtiene el valor de q de tablas con k, n-k y valor 𝛂


´ *Si hay ni distintas en cada grupo, se elige la n menor
Tabla de Análisis de Varianza o
Tabla de ANOVA k= número de grupos

Fuente de Suma de Grados de Cuadrado F F crítico


variación Cuadrados libertad Medio (CM)
(SC)

Grupos 58.53 2 29.26 4.95 3.8853

Residual o
71.2 12 5.93
del Error

Total 129.73 14 /
!"#$%&'()* ,../
DHS = q = 3.77 = 4.10
+ ,

Después se calculan todas las diferencias Sin Desayuno Desayuno


desayuno ligero completo
entre medias de muestra:
8 14 10
´ 𝑥#̅ − 𝑥̅" = |9.4 -14| = 4.6 7 16 12
´ 𝑥#̅ − 𝑥̅O = |9.4 - 13|= 3.6 9 12 16
13 17 15
´ 𝑥̅" − 𝑥̅O =|14 -13| = 1
10 11 12

∑ 𝑥 =47 ∑ 𝑥 =70 ∑ 𝑥 =65


Si 𝑥̅= − 𝑥>̅ > DHS , se rechaza Ho y 𝑥#̅ =9.4 𝑥̅" =14 𝑥̅$ = 13
entonces µi ≠ µj
DHS = 4.10
Sin Desayuno Desayuno
desayuno ligero completo
8 14 10
Si 𝑥̅! − 𝑥P̅ > DHS ,
7 16 12
se rechaza Ho y entonces µi ≠ µj
9 12 16
13 17 15
´ 𝑥#̅ − 𝑥̅" = 4.6 > 4.10 entonces: µ1 ≠ µ2 10 11 12
´ 𝑥#̅ − 𝑥̅$ =|9.4 - 13|= 3.6 < 4.10: µ1 = µ3 𝑥#̅ =9.4 𝑥̅" =14 𝑥̅$ =13
´ 𝑥̅" − 𝑥̅$ =|14 -13| = 1 < 4.10 : µ2 = µ3
Producción de residuos electrónicos
por persona 2014 ( kg/habitante ) 0.01
´ Se obtuvo una muestra aleatoria de datos de cada región:

Europa
Latinoamérica Asia
/USA-Canadá
8 22 9
7 17 4
7 20 1
10 18 7
5 22

H0: µ1 = µ2 = µ3
Ha: al menos una µ es diferente
Europa
Latinoamérica Asia
/USA-Canada
8 22 9
7 17 4
7 20 1
𝚺𝚡i= 157
10 18 7
5 22 𝚺grupo1= 37
𝚺𝚡1= 37 𝚺𝚡2= 99 𝚺𝚡3=21 𝚺grupo2=99
Europa 𝚺grupo3= 21
Latinoamérica Asia
/USA-Canada
x2 x2 x2
64 484 81
49 289 16
𝚺𝚡i2 = 2415
49 400 1
100 324 49
25 484
𝚺𝚡12=287 𝚺𝚡22=1981 𝚺𝚡32=147
Tabla de Análisis de Varianza o
Tabla de ANOVA
Fuente Suma de Cuadrados G.L. Cuadrado F
de (SC) Medio (CM)
variación
∑ 𝑔𝑟𝑢𝑝𝑜𝑗 " ∑ 𝑥! " 𝑆𝐶𝐺𝑟𝑢𝑝𝑜𝑠 𝐶𝑀𝐺𝑟𝑢𝑝𝑜𝑠
Grupos ) − k-1
𝑛# 𝑁 𝑘−1 𝐶𝑀𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙
-
𝑆𝐶𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙
Residual ) 𝑛! − 1 𝑠!" N- k -
𝑁−𝑘
!,+

∑𝑥 "
"
Total ) 𝑥! – N-1 - -
𝑁
Tabla de Análisis de Varianza o
Tabla de ANOVA
Fuente Suma de G.L. Cuadrado F F crítico
de Cuadrados (SC) Medio
variación (CM)

Grupos 583.60 2 291.8 45.38 7.206

Residual 70.75 11 6.43 / /

Total 654.35 13 / / /
∑ SCGTUP ! ∑ V# !
𝑆𝐶𝐺𝑟𝑢𝑝𝑜𝑠 = ∑ −
J" W
OX ! YY ! "# ! #%X !
𝑆𝐶𝐺𝑟𝑢𝑝𝑜𝑠= %
+ %
+ Z
- #Z
=583.60

Si Fcalculado > Fcrítico se rechaza la H0


, por lo tanto H0 se rechaza y al menos una µ es ≠

También podría gustarte