3 GuiTPANA ANOVA

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 14

Estadística Analítica 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.

DISEÑO COMPLETAMENTE ALEATORIZADO (DCA)


ANÁLISIS DE LA VARIANZA (ADEVA)

Objetivos específicos
 Comprender la importancia de las aplicaciones del análisis de la varianza.
 Adquirir vocabulario específico y manejar algunos métodos del Diseño Experimental.
 Aplicar análisis de la varianza paramétrico y no paramétrico, según corresponda, en casos relativos
al campo profesional del veterinario.

Contenidos temáticos
Concepto de Modelo. Supuestos. Método de mínimos cuadrados. ADEVA para DCA. Prueba de hipótesis
para comparar valores medios de más de dos tratamientos. Análisis de varianza de una clasificación por
rangos de Kruskal-Wallis. Aplicaciones. Interpretación de análisis realizados mediante programas de
computación.

Glosario
Diseño completamente aleatorizado (DCA). Modelo estadístico. Análisis de la varianza (ADEVA) para un
DCA, Modelo I. Pruebas de Hipótesis. Suma de cuadrados. Cuadrado medio. Varianza. Análisis de
varianza Kruskal-Wallis. Rango. Variables al menos ordinales. Mediana.

PROBLEMAS RESUELTOS

EJERCICIO 1) Para comparar cuatro suplementos “de engorde” en bovinos de carne, se seleccionaron,
al azar, cuarenta animales Hereford de iguales edad y sexo, y de pesos homogéneos para ser usados en
un experimento. Los suplementos a comparar se definieron sobre la base de las características del grano
de maíz empleado (“entero” o “partido”) y la fuente comercial de vitaminas y minerales (“A” y “B”).
Entonces el suplemento 1 (S1) estuvo constituido por grano partido y fuente A, mientras que el
suplemento 2 (S2) por grano partido y fuente B, el suplemento 3 (S3) por grano entero y fuente A, y el
suplemento 4 (S4) por grano entero y fuente B. Se asignaron aleatoriamente 10 animales por
suplemento, los que fueron alimentados individualmente con una dieta estándar más el correspondiente
suplemento durante 80 días. Se registra la eficiencia de conversión (EfCon) individual (kg Materia Seca/
kg Ganancia de Peso) cuyos resultados se presentan en las siguientes tablas:

S1 3,3 4,4 4,9 4,9 3,9 4,2 4,7 5,1 4,6 4,5 Análisis de la varianza – Test de Levene
S2 4,6 4,5 5 4 4,5 5,2 4,9 5,5 4,8 5,3 Variable N R² R² Aj CV
Abs_dif 40 0,07 0,00 75,24
S3 6,7 5,8 5 4,8 5,3 6,2 5 6,4 5,9 5,4 Cuadro de Análisis de la Varianza (SC tipo III)
S4 6,3 6 6,7 5,5 6,6 6,1 5,3 6,5 6,3 6,8 F.V. SC gl CM F p-valor
Modelo 0,25 3 0,08 0,86 0,4716
Shapiro-Wilks (modificado) Tratam 0,25 3 0,08 0,86 0,4716
Variable n Media D.E. W* p (una cola) Error 3,51 36 0,10
S1 10 4,45 0,54 0,92 0,5174 Total 3,76 39
S2 10 4,83 0,45 0,97 0,9167
S3 10 5,65 0,65 0,92 0,4806 Análisis de la varianza
S4 10 6,21 0,50 0,90 0,3451 Variable N R² R² Aj CV
RE_EfCon 40 0,00 1,01 0,96 0,4386 EfCon 40 0,65 0,62 10,32
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 19,87 3 6,62 22,18 <0,0001
Tratam 19,87 3 6,62 22,18 <0,0001
Error 10,76 36 0,30
Total 30,63 39

43
Estadística Analítica 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

a) ¿Cuál es el objetivo del experimento?


b) Defina la unidad experimental ¿En qué condiciones se desarrolla el experimento? ¿Qué se registra?
c) ¿Qué diseño se empleó? ¿Por qué? ¿qué se asumió?
d) ¿Cuál será el modelo teórico a emplear? Interpretar cada uno de sus componentes e indicar los paráme-
tros del diseño.
e) ¿Qué puede decir con respecto a la validez del DCA paramétrico?
f) Escribir las hipótesis de interés, y teniendo en cuenta la salida de computadora concluir al 5%.
g) Los investigadores creen que al comparar los suplementos 1 y 4 se podrán encontrar diferencias signi-
ficativas en los valores medios de la eficiencia de conversión de los bovinos. Comprobar estadística-
mente al 10% expresando las hipótesis estadísticas, región crítica y decisión.

SOLUCIÓN

a) Objetivo: comparar la efectividad de cuatro suplementos diferentes para “engorde”.


Los suplementos se definieron sobre la base de las características del grano de maíz empleado (“entero”
o “partido”) y la fuente comercial de vitaminas y minerales (“A” y “B”) quedando constituidos por:

Suplemento 1 (S1): grano partido y fuente A


Suplemento 2 (S2): grano partido y fuente B
Suplemento 3 (S3): grano entero y fuente A
Suplemento 4 (S4): grano entero y fuente B.

b) Unidad experimental: un bovino de raza Hereford.

Condiciones en que se desarrolla el experimento: 40 bovinos de raza Hereford de iguales edad y sexo, y
de pesos homogéneos, alimentados individualmente con una dieta estándar más el correspondiente
suplemento durante 80 días. Se asigna al azar igual cantidad de bovinos a cada dieta.

Variable respuesta: Eficiencia de conversión de un bovino (kg Materia Seca/ kg Ganancia de Peso)

La variable respuesta se mide en bovinos que son sometidos a cuatro tratamientos:


Dieta a base de suplemento 1
Dieta a base de suplemento 2
Dieta a base de suplemento 3
Dieta a base de suplemento 4

Es decir, una variable registrada en cuatro poblaciones. En éste caso la Dieta es el factor que tiene cua-
tro niveles (S1, S2, S3 y S4).

c) Se aplicó un diseño completamente aleatorizado (DCA) debido a que los animales se asignaron sin res-
tricciones a los tratamientos. Se asumió que:
 los factores raza, peso y sexo podían influir en los resultados por lo cual fueron controlados por el
experimentador. Además se seleccionó como factor de interés a la dieta.
 No hay otros factores que influyan en los resultados del experimento.

d) El modelo teórico de DCA modelo fijo es:


Yij = i + ij para i=1, 2, 3, 4; j=1, 2, …, N
Donde:
Yij: Eficiencia de conversión registrada en el j-ésimo bovino de raza Hereford que recibió la i-ésima dieta.
(variable aleatoria)
i: Eficiencia de conversión media poblacional de los bovinos Hereford que recibieron la i-ésima (pará-
metro)
ij: variable aleatoria no observable correspondiente a la respuesta propia del j-ésimo bovino de raza He-
2
reford que recibió la i-ésima dieta. ( ~ N(0,  )). (variable aleatoria)

En cuanto a los parámetros del diseño, son:


 i (i=1, 2, 3, 4) que está presente en la ecuación del modelo y
2
  que es la varianza de los errores del modelo ().
44
Estadística Analítica 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

e) Condiciones para la elección de la variable pivotal:


Antes de realizar el estudio, deberíamos verificar si:
i) Las observaciones de eficiencia de conversión son independientes entre y dentro de cada tratamiento.
ii) Para cada suplemento existe una subpoblación de valores de Eficiencia de conversión de los bovinos
Hereford de sexo, edad y peso inicial similares con distribución normal
iii) Para cada suplemento existe una subpoblación de valores de Eficiencia de conversión de los bovinos
Hereford de sexo, edad y peso inicial semejantes con igual varianza.

i) Esta condición se cumple porque los animales inicialmente eran homogéneos en cuanto a las otras
características (peso, raza y sexo), fueron aleatorizados irrestrictamente y por lo tanto la eficiencia de
conversión de un bovino es independiente de la de otro.

ii) La segunda condición se puede probar a partir de la variable respuesta o de los errores del modelo:

1) A partir de la variable respuesta:

Para analizar la normalidad de la variable respuesta, debemos hacerlo dentro de cada tratamiento. Por
ello, distinguiremos en la variable respuesta a 4 variables, cada una observada en una población. Éstas
son:
- Ef de conversión (S1) de un bovino (kg Mat Seca/ kg Gan de Peso) alimentado con el suplemento 1.
- Ef de conversión (S2) de un bovino (kg Mat Seca/ kg Gan de Peso) alimentado con el suplemento 2.
- Ef de conversión (S3) de un bovino (kg Mat Seca/ kg Gan de Peso) alimentado con el suplemento 3.
- Ef de conversión (S4) de un bovino (kg Mat Seca/ kg Gan de Peso) alimentado con el suplemento 4.

Observando los p-valores se puede decir que en las cuatro poblaciones ocurre que, al 10%, no se rechaza la
hipótesis de normalidad de Eficiencia de conversión.
2 2
H0: S1 se distribuye N(1 , 1 ) H0: S3 se distribuye N(3 , 3 )
2 2
H1: S1 no se distribuye N(2 ,1 ) H1: S3 no se distribuye N(3 ,3 )
No rechazo H0 si el p-valor > 0,10 No rechazo H0 si el p-valor > 0,10
Rechazo H0 si el p-valor ≤ 0,10 Rechazo H0 si el p-valor ≤ 0,10
Como el p-valor es 0,5174  0,10 no se rechaza H0 Como el p-valor es 0,4806  0,10 no se rechaza H0
2 2
H0: S2 se distribuye N(2 , 2 ) H0: S4 se distribuye N(4 , 4 )
2 2
H1: S2 no se distribuye N(2 ,2 ) H1: S4 no se distribuye N(4 ,4 )
No rechazo H0 si el p-valor > 0,10 No rechazo H0 si el p-valor > 0,10
Rechazo H0 si el p-valor ≤ 0,10 Rechazo H0 si el p-valor ≤ 0,10
Como el p-valor es 0,9167  0,10 no se rechaza H0 Como el p-valor es 0,3451  0,10 no se rechaza H0

A modo de ejemplo, se concluirá para el suplemento 1, siendo luego similares las conclusiones para los
restantes suplementos:

Con un nivel de significación del 10%, no existen evidencias suficientes para rechazar la hipótesis nula
2
(H0: S1 se distribuye N (1 , 1 )) por lo tanto, puedo decir que la Eficiencia de conversión por los bovinos
que consumieron el Suplemento 1 (S1): grano partido y fuente A, se distribuye normalmente en esta po-
blación de bovinos Hereford de iguales edad y sexo en estudio.

2) A partir de los errores.

Dado que el modelo es: Yij = i + ij para i=1, 2, 3, 4; j=1, 2, …, 10

El error correspondiente a una observación es la diferencia entre el valor observado y valor medio esperado
es decir ij = Yij - i
Y, dado que los parámetros son información fija (i, i=1, 2, 3, 4) suponer que la variable respuesta se
distribuye normalmente con cierta media poblacional y única varianza poblacional es equivalente a

45
Estadística Analítica 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

suponer normalidad para los errores con media poblacional cero y la misma varianza poblacional. (ij  N
2
(0,  )
Dado que los errores son no observables el supuesto se verifica utilizando sus equivalentes a nivel
muestral llamados residuos. eij = Yij  Yi

Hipótesis estadísticas:
2
H0: ij se distribuye N(0,  )
2
H1:  ij no se distribuye N(0, )

No rechazo H0 si el p-valor>0,10
Rechazo H0 si el p-valor≤0,10

Como el p-valor es de 0,43860,10 no se rechaza H0

Con un nivel de significación del 10% no existen evi-


dencia suficiente para rechazar H0, es decir que los
errores provenientes del modelo propuesto (DCA
Modelo fijo: variable respuesta: Eficiencia de conver-
sión de un bovino; factor: suplemento dietario; niveles:
Suplemento 1 (S1): grano partido y fuente A, Su-
plemento 2 (S2): grano partido y fuente B, Suple-
mento 3 (S3): grano entero y fuente A, Suplemento En el gráfico no se observan puntos (residuos)
4 (S4): grano entero y fuente B) se distribuyen nor- con gran alejamiento de los valores normales
malmente en estas poblaciones de bovinos Hereford teóricos, por lo que se puede suponer que la
de iguales edad y sexo en estudio. distribución que siguen los errores es normal.

iii) Para analizar homogeneidad de varianzas, primero observemos el siguiente gráfico:

En el diagrama de dispersión ( residuos vs valores


predichos) no se observan diferencias notorias
entre las varianzas de la Eficiencia de conversión
en bovinos de raza Hereford de iguales edad y
sexo para cada suplemento “de engorde” en
bovinos para carne.

Para verificar la condición mediante un test estadístico se puede aplicar la prueba de Levene
H0 :  12   22   32   42   2
H1 : algún  i2   2 i=1, 2, 3, 4

Se calcula para cada observación (repetición j-ésima del i-ésimo tratamiento) la diferencia en valor
absoluto entre su puntuación (Yij) y la mediana del grupo o nivel del factor al que pertenece (Mnai)
obteniendo así una nueva variable, denominada Absdif (valor absoluto de la diferencia).

46
Estadística Analítica 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

dif ij  yij  Mnai i=1, 2, 3, 4 j=1, 2, …, 10

Con ésta variable (dif) se realiza un ANOVA.

Análisis de la varianza – Test de Levene


Variable N R² R² Aj CV VP: F= CMtrat / CMerror ~ F(gl trat; gl error)
Abs_dif 40 0,07 0,00 75,24
Cuadro de Análisis de la Varianza (SC tipo III)
Rechazo H0 si F≥2,87
F.V. SC gl CM F p-valor
Modelo 0,25 3 0,08 0,86 0,4716 No rechazo H0 si F<2,87
Tratam 0,25 3 0,08 0,86 0,4716
Error 3,51 36 0,10 Como el F es 0,86 no se rechaza la hipótesis nula
Total 3,76 39

Con un nivel de significación del 5%, no tengo evidencias suficientes para rechazar Ho
( 1   22   32   42   2 ) por lo tanto se puede considerar que las varianzas poblacionales de la
2

Eficiencia de conversión de bovinos que consumieron el Suplemento 1 (S1): grano partido y fuente A, el
Suplemento 2 (S2): grano partido y fuente B, el Suplemento 3 (S3): grano entero y fuente A, y el
Suplemento 4 (S4): grano entero y fuente B; son iguales en estas poblaciones de bovinos Hereford de
iguales edad y sexo en estudio.

f) Verificadas las condiciones en los puntos anteriores, seleccionamos el DCA paramétrico por lo que
miramos la tabla ANOVA (o ADEVA) realizada sobre la variable respuesta del diseño.

Análisis de la varianza
Variable N R² R² Aj CV
EfCon 40 0,65 0,62 10,32

Cuadro de Análisis de la Varianza (SC tipo III)


F.V. SC gl CM F p-valor
Modelo 19,87 3 6,62 22,18 <0,0001
Tratam 19,87 3 6,62 22,18 <0,0001  Significativo
Error 10,76 36 0,30
Total 30,63 39

Las hipótesis estadísticas son:


H0: i =  para i=1, 2, 3, 4
H1: algún i ≠ 

Variable Pivotal : F= CMtrat / CMerror ~ F(gl trat; gl error) ~ F(3; 36)

Valor Critico: F(3 ; 36) ; 0,95

Como este valor no se encuentra en tabla, se usa el n anterior


F(3 ; 35) ; 0,95 = 2,87

Región Critica
Rechazo H0 si Fobs ≥ 2,87
No rechazo H0 si Fobs < 2,87

Como F=22,18 >2,87 rechazamos H0.


Si observamos el pvalor se tiene que p-valor<0,0001<0,05 se llega a la misma decisión.

Se concluye:
Con un nivel de significación del 5% existe evidencia suficiente para rechazar H0 (i = 
para i=1, 2, 3, 4), por lo tanto al menos un valor medio poblacional de Eficiencia de conversión en
bovinos alimentados con Suplemento 1 (grano partido y fuente A), Suplemento 2 (grano partido y fuente
B), Suplemento 3 (grano entero y fuente A), o Suplemento 4 (grano entero y fuente B) difiere de los
restantes en estas poblaciones de bovinos Hereford de similares edades y sexos en estudio.
47
Estadística Analítica 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

Nota: Cuando se rechaza la hipótesis nula, es decir todos los valores medios no son iguales, es interesante comparar
los valores medios poblacionales para ver cuál o cuales son diferentes. Existen diferentes métodos de comparacio-
nes múltiples pero esta parte del estudio escapa de los alcances de esta materia.

g) Planteemos las hipótesis estadísticas


H0: 1 = 4
H1:1 ≠ 4

Luego de testeadas las condiciones de DCA, se supone que las variables en estudio se distribuyen
normalmente y poseen varianzas poblaciones desconocidas pero iguales. Por lo tanto se utiliza la variable
pivotal:

t
 x1  x4    1  4  ~ t
18
1 1
sa 
n1 n4

Así la región crítica será: t ≤ -1,73 U t ≥ 1.73


Realizando el reemplazo con los datos hallados en las tablas presentadas, resulta tH0= -7,59, por lo que se
decide rechazar H0.

EJERCICIO 2) El esculeno es un hidrocarburo insaturado que se encuentra en aceites vegetales. En


una experiencia se desea comparar cuantitativamente el contenido de esta sustancia entre 4 aceites ve-
getales: maní, maíz, soja y girasol. Para ello se tomaron aleatoriamente 8 alicuotas por cada tipo de acei-
te determinándose el contenido de esculeno en mg/100 g de aceite. (nota: en caso de ser necesario,
asumir distribuciones simétricas)

a) ¿Cuál es el objetivo del experimento?


b) ¿Cuál fue la unidad experimental? ¿Qué se registra?
c) Interpretar la observación resaltada en la tabla 1.
d) Calcular e25 y e36 e interpretar.
e) Verificar las condiciones para cumplir con el objetivo de los investigadores.
f) Teniendo en cuenta lo decidido en el punto anterior y que el nivel de significación es del 5%, realizar
la prueba en forma completa.

Tabla 1:
Contenido de esculeno (mg/100 g de aceite)
Maní 21 22 38 13 23 25 14 16
Maíz 33 18 14 21 27 17 15 23
Aceite
Soja 8 12 21 9 16 7 6 11
Girasol 5 12 10 13 9 10 15 6

Tabla 2:
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(unacola)
RE_Esculeno 32 -0,02 0,95 0,90 0,0180

Tabla 3:
Análisis de la varianza – Test de Levene
Variable N R² R² Aj
abs dif 32 0,09 0,00
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 43,38 3 14,46 0,95 0,4292
Aceite 43,38 3 14,46 0,95 0,4292
Error 425,50 28 15,20
Total 468,88 31

48
Estadística Analítica 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

Tabla 4:
Prueba de Kruskal Wallis
Variable Aceite N Medias D.E. Medianas H p
Esculeno Girasol 8 10,00 3,38 10,00 17,79 0,0005
Esculeno Maíz 8 21,00 6,48 19,50
Esculeno Maní 8 21,50 7,98 21,50
Esculeno Soja 8 11,25 5,06 10,00

SOLUCIÓN

a) Objetivo: comparar el contenido medio de esculeno en aceites vegetales provenientes de maíz, maní,
girasol y soja.

b) La unidad experimental es una alicuota de aceite, a la que se le observa la concentración de esculeno,


medida en mg/100 g de aceite.

c) Y25=27 puede interpretarse como la concentración de esculeno, medida en mg/100 g de aceite de la


quinta muestra de aceite de maíz.

d) Sabiendo que e25= Y25 - .

Nota: el valor de puede obtenerse de la salida de estadística descriptiva o calcularse como Y2 


Y 2i

n2
Reemplazando :
e25= 27 – 21 = 6 mg/100 g de aceite. La quinta muestra de aceite de maíz tiene una concentración de
esculeno de 6 mg/100 g por encima del promedio de su grupo.
E36= 7 – 21.5 =-14.5 mg/100 g de aceite. La sexta muestra de aceite de maní tiene una concentración de
esculeno de 14.5 mg/100 g por debajo del promedio de su grupo.

e) Comenzaremos a analizar las tres condiciones para un DCA paramétrico:

i) Los errores (ij) son independientes dado que en cada población, las muestras de aceite fueron
seleccionadas al azar y el contenido de esculeno de una alicuota es independiente del contenido de
esculeno de otra.

ii) Normalidad de los errores provenientes del modelo

Hipótesis estadísticas:
2
H0: ij ~N(0,  )
2
H1: ij no tiene distribución N(0,  )

Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(unacola)
RE_Esculeno 32 -0,02 0,95 0,90 0,0180

No rechazo H0 si el p-valor>0,10
Rechazo H0 si el p-valor≤0,10
Como p-valor =0,0180≤0,10 entonces rechazo H0

Con un nivel de significación del 10% existen


evidencias suficientes para rechazar H0, es decir
que los errores provenientes del modelo propuesto
Se observan varios residuos que son de gran
(DCA Modelo fijo: variable respuesta:
magnitud y se alejan de los valores normales
concentración de esculeno, medida en mg/100 g
teóricos lo que pone en duda el supuesto de
de aceite; fator: tipo de aceite; niveles: maíz, maní,
normalidad de los errores
girasol y soja) no se distribuyen normalmente en
49
Estadística Analítica 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

estas poblaciones de aceites en estudio.

Al no cumplirse una de las condiciones entonces no es válido utilizar un DCA Modelo 1 o fijo paramétrico.
Hay que verificar que se cumplan las condiciones para realizar una prueba no paramétrica de Kruskal
Wallis:
- Las observaciones de concentración de esculeno en cada alicuota son independientes, debido a que los
cuatro tipos de aceites lo son y la muestra fue tomada aleatoriamente para cada uno de ellos
- La variable concentración de esculeno en aceite es cuantitativa continua, por lo que es de una escala
superior a la ordinal.
- La variable concentración de esculeno en aceite, medida en mg/100 g de aceite; posee distribuciones
similares para el factor tipo de aceite con niveles: maíz, maní, girasol y soja. Esta condición no la proba-
remos pero podríamos darnos una idea intuitiva a través de graficos de box plot.

f) Realicemos la prueba correspondiente que sería la del DCA de libre distribución (no paramétrico):
Kruskal Wallis:

Hipótesis estadísticas
H0 : θ1= θ2= θ3= θ4= θ
H1 : algún θi≠ θ i=1, 2, 3, 4

Es decir que se quiere probar si la variable concentración de esculeno en aceite tiene la misma posición
central para los cuatro vegetales: maíz, maní, girasol y soja.

El estadístico de contraste es H que distribuye aproximadamente como una Chi cuadrado con I-1 grados
de libertad siendo I la cantidad de tratamientos.
2
12 I Ri .
H
N ( N  1)
 i 1
ni
 3( N  1)  X 2 I 1

Region critica:
2 2
ᵡ ≥ᵡ 3;0.95 =7.815 Donde N= 32;

Por lo tanto:
Rechazo H0 si H ≥7,815
No rechazo H0 si H <7,815

A modo de ejemplo, se desarrolla el calculo del estadístico bajo H0:

2 2
Rij Ri. Ri Ri /8
Maní 24 26 32 13,5 27,5 29 15,5 19,5 187,0 34969,00 4371,12500
Maíz 31 22 15,5 30 24 21 17,5 27,5 188,5 35532,25 4441,53125
Soja 5 11,5 24 6,5 19,5 4 2,5 10 83,0 6889,00 861,12500
Girasol 1 11,5 8,5 13,5 6,5 8,5 17,5 2,5 69,5 4830,25 603,78125
total= 10277,56250

2
12 I Ri . 12
H
N ( N  1)
 i 1
ni
 3( N  1) 
32*33
*10277,5625  3*33 

 116, 7905  99  17,7905


Se tomará la decisión correspondiente a partir de la salida de Info Stat:

Nota: el valor de HH0 puede observarse en la salida de Kruskal Wallis.


Tambien se observa el p-valor en esta tabla. Podria tomarse una decisión con elmismo, de la forma en la que se vio
en la unidad anterior.

50
Estadística Analítica 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

Prueba de Kruskal Wallis


Variable Aceite N Medias D.E. Medianas H p
Esculeno Girasol 8 10,00 3,38 10,00 17,79 0,0005
Esculeno Maíz 8 21,00 6,48 19,50
Esculeno Maní 8 21,50 7,98 21,50
Esculeno Soja 8 11,25 5,06 10,00

Dado que H = 17,79 > 7,815 se rechaza la hipótesis nula

Conclusión: Trabajando con un nivel de significación del 5%, hay evidencias suficientes para rechazar H0
(θ1= θ2= θ3= θ4= θ) por lo que se puede suponer que al menos alguna de las medianas poblacionales de la
concentración de esculeno en aceites vegetales difiere de las restantes en las poblaciones de aceites
vegetales de maíz, maní, girasol y soja.
PROBLEMAS PROPUESTOS
EJERCICIO 1) Para comparar cinco dietas para porcinos se seleccionaron veinticinco cerdos al azar
para ser usados en el experimento. Aleatoriamente se les asignó una dieta a cada grupo de 5 cerdos
cada uno, midiéndose sobre cada animal el peso inicial y el peso al cabo de 30 días.
Responder:
a) La unidad experimental es ...........................................................................................................
b) Los tratamientos son...................................................................................................................
c) La observación es.......................................................................................................................
d) El objetivo del trabajo es............................................................................................................

EJERCICIO 2) Se realizó un ensayo para estudiar el efecto de 5 raciones sobre la ganancia de peso de
novillos. Para ello se emplearon 5 lotes de 6 animales cada uno seleccionados aleatoriamente, de la misma
raza y edad. Los datos sobre las ganancias de peso por animal expresada en kg, para el período total del
ensayo se expresan en la siguiente tabla:
Tabla 1: Tratamientos
Estadística descriptiva 1 2 3 4 5
Trat Variable n Media D.E. Mín Máx Mediana
43 54 62 61 85
1 Ganancia 6 43,50 3,56 39 49 43,00
2 Ganancia 6 52,00 2,76 48 55 52,50 49 54 55 66 83
3 Ganancia 6 58,17 2,64 55 62 58,00 39 50 59 62 89
4 Ganancia 6 63,83 2,71 61 68 63,00 41 48 57 64 91
5 Ganancia 6 86,50 3,67 82 91 87,00
Total 30 60,80 15,04 39 91 58,00 43 51 60 68 89
46 55 56 62 82
Tabla 2
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
REGanancia 30 0.00 2,88 0.92 0.1103

Tabla 3
Análisis de la varianza – Test de Levene
Variable N R²
abs dif 30 0,06
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 4,03 4 1,01 0,41 0,8031
Tratamientos 4,03 4 1,01 0,41 0,8031
Error 62,21 25 2,49
Total 66,24 29

Tabla 4
Análisis de la varianza
Variable N R² R² Aj CV
Ganancia 30 0,96 0,96 5,10
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F
51
Estadística Analítica 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

Modelo 6320,13 4 1580,03 164,13


Tratamientos 6320,13 4 1580,03 164,13
Error 240,67 25 9,63
Total 6560,80 29

Tabla 5
Prueba de Kruskal Wallis
Variable Tratamientos N Medianas H p
Ganancia 1 6 43,00 27,35 <0,0001
Ganancia 2 6 52,50
Ganancia 3 6 58,00
Ganancia 4 6 63,00
Ganancia 5 6 87,00

A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems:
a) ¿Qué tipo de diseño se ha realizado? ¿Qué características tiene?
b) Expresar el modelo teórico correspondiente a un DCA Paramétrico e interpretar los parámetros del
diseño.
c) Interpretar la observación resaltada en la tabla 1.
d) Calcular e25 e interpretarlo.
e) Verificar en forma completa si se cumplen las condiciones para un DCA modelo fijo paramétrico. En
caso de realizar un test SOLO exprese las hipótesis estadísticas y decisión justificada.
f) Teniendo en cuenta lo decidido en el punto anterior y que el nivel de significación es del 5%, realizar la
prueba correspondiente.
g) Los investigadores creen que las ganancias de peso de los novillos que recibieron la primera ración,
en promedio, son significativamente menores a las ganancias de peso de los novillos que recibieron la
cuarta ración. Pruebe estadísticamente al 10% la hipótesis de los investigadores.

EJERCICIO 3) Un fisiólogo estudió la función pituitaria de las gallinas ponedoras asociada a cada etapa del
régimen estándar para muda forzada de plumas que usan los productores de huevos con el fin de mantener
a las aves en producción. Las etapas de la dieta son cinco: (A) premuda, previa al inicio del régimen; (B)
ayuno de 8 días; (C) 60 gr de salvado durante 10 días; (D) 80 gr de salvado durante 10 días; y (E) mezcla de
malta durante 42 días. En el estudio se utilizaron 25 gallinas elegidas aleatoriamente. Todas fueron puestas
bajo la misma dieta en jaulas. Después de cada etapa, se seleccionaron aleatoriamente grupos de cinco y se
las sacrificó. Interesa saber si las distintas etapas afectaban la concentración de T3 en suero. Se obtuvo co-
mo resultado el siguiente conjunto de observaciones:

Etapas de Dieta Concentración de T3 (ng/dl) en suero


Premuda (A) 94.09 90.45 99.38 91 98.00
Ayuno (B) 117.9 115 115.23 129.06 117.61
60 g de Salvado (C) 197.18 207.31 194 192.50 202.25
80 g de Salvado (D) 112.47 117.51 119.92 112.01 110
Mezcla de malta (E) 83.14 89.59 87.76 82.94 79.21

Estadística descriptiva
Etapas Variable n Media D.E. Mín Máx Mediana Q1 Q3
a T3 5 94,58 4,03 90,45 99,38 94,09 91,00 98,00
b T3 5 118,96 5,80 115,00 129,06 117,61 115,23 117,90
c T3 5 198,65 6,11 192,50 207,31 197,18 194,00 202,25
d T3 5 114,38 4,15 110,00 119,92 112,47 112,01 117,51
e T3 5 84,53 4,15 79,21 89,59 83,14 82,94 87,76

52
Estadística Analítica 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

Tabla 1
Shapiro-Wilks (modificado) Tabla 4
Variable n Media D.E. W* p (una cola) Prueba de Kruskal Wallis
RE_T3 25 -4,5E-03 1,03 0,90 0,0469 Variable Etapas N Medias D,E, Medianas H
T3 a 5 94,58 4,03 94,09 22,24
Tabla 2 T3 b 5 118,96 5,80 117,61
Análisis de la varianza – Test de Levene T3 c 5 198,65 6,11 197,18
Variable N R² R² Aj CV T3 d 5 114,38 4,15 112,47
abs dif 25 0,04 0,00 97,95 T3 e 5 84,53 4,15 83,14
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 8,66 4 2,17 0,19 0,9412
Etapas 8,66 4 2,17 0,19 0,9412
Error 228,87 20 11,44
Total 237,53 24

Tabla 3
Análisis de la varianza
Variable N R² R² Aj CV
T3 25 0,99 0,99 4,04
Cuadro de Análisis de la Varianza (SC tipo III)
F,V, SC gl CM F p-valor
Modelo 40488,68 4 10122,17 415,95 <0,0001
Etapas 40488,68 4 10122,17 415,95 <0,0001
Error 486,70 20 24,33
Total 40975,38 24

A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems:
a) Definir la variable respuesta en estudio
b) Expresar el modelo teórico para un DCA Modelo fijo paramétrico e interpretar todas las variables que
lo componen.
c) Interpretar la observación destacada en la tabla y calcular su correspondiente residuo.
d) Enunciar y verificar las condiciones para un DCA Modelo fijo paramétrico.
e) Teniendo en cuenta lo decidido en el punto anterior y que el nivel es del 5%, realice la prueba
correspondiente.
f) Si lo investigadores quieren comparar la homogeneidad de varianzas entre las etapas premuda y ayuno
al 1%, plantear las hipótesis estadísticas correspondientes, la variable pivotal y la región crítica.

EJERCICIO 4) (Un experimento ilegal). Es un hecho muy conocido que casi todos los caballos que co-
rren carreras “cuadreras” o extraoficiales, reciben tratamientos medicamentosos que en las carreras ofi-
ciales no están permitidos. Todos los cuidadores afirman que de otro modo no es posible competir, pero
la efectividad de esos tratamientos suele ser objeto de polémicas. A tal efecto se diseñó un experimento
para comparar a tres de tales tratamientos, con 5 caballos elegidos al azar cada uno y un grupo testigo,
53
Estadística Analítica 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

sin medicar. Se utilizaron, en consecuencia, 20 caballos seleccionados al azar de características lo más


similares posibles (en velocidad, edad, sanidad). Se registraron en cada caso los tiempos (en segundos)
empleados en una corrida a fondo sobre la distancia clásica cuadrera de 300 metros en pista normal, con
los siguientes resultados:
Trat 1 Trat 2 Trat 3 Trat 4 (control)
17,96 17,80 18,30 18,60
17,62 17,90 18,50 18,80
17,90 17,68 18,40 18,60
17,70 17,72 18,22 18,90
17,70 18,00 18,30 18,80

Tabla 1 Tabla 3
Shapiro-Wilks (modificado) Análisis de la varianza
Variable n Media D.E. W* p (una cola) Variable N R² R² Aj CV
RE_Tiempo 20 0.01 1.06 0.87 0.0201 Tiempo 20 0,92 0,91 0,72
Cuadro de Análisis de la Varianza (SC tipo III)
Tabla 2 F,V, SC gl CM F p-valor
Análisis de la varianza Modelo 3,16 3 1,05 61,90 <0,0001
Variable N R² R² Aj CV Tratamiento 3,16 3 1,05 61,90 <0,0001
abs dif 20 0,02 0,00 98,82 Error 0,27 16 0,02
Cuadro de Análisis de la Varianza (SC tipo III) Total 3,44 19
F.V. SC gl CM F p-valor
Modelo 2,9E-03 3 9,6E-04 0,11 0,9550 Tabla 4
Trat 2,9E-03 3 9,6E-04 0,11 0,9550 Prueba de Kruskal Wallis
Error 0,14 16 0,01 Variable Tratamiento N Medianas H p
Total 0,15 19 Tiempo 1 5 17,70 16,17 0,0010
Tiempo 2 5 17,80
Tiempo 3 5 18,30
Tiempo 4 5 18,80

A partir de los gráficos y las salidas correspondien-


tes, responda los siguientes ítems:

a) Expresar el modelo teórico correspondiente a un


DCA paramétrico Modelo fijo e interpretar todos sus
parámetros.
b) Calcular el residuo de la observación destacada
en la tabla e interpretarlo en el contexto del proble-
ma.
c) Enunciar y verificar las condiciones necesarias
para comparar la efectividad de los tratamientos. En
caso de realizar un test de hipótesis NO CONCLUIR.
d) Teniendo en cuenta lo decidido en el punto
anterior y que el nivel es del 10%, realice la prueba
correspondiente en forma completa.

EJERCICIO 5) Interesa determinar si existen diferencias significativas entre las concentraciones medias de
glucosa registradas luego de aplicar diferentes drogas a conejos de raza Angora. Para ello se empleó un
conjunto de 18 conejos seleccionados al azar y se lo dividió aleatoriamente en tres grupos. Cada grupo reci-
bió una droga diferente. Al cabo de cierto tiempo se midió la concentración de glucosa en plasma, en mg/100
ml, y se obtuvieron los siguientes datos:

Droga A: 94 97 84 92 95 107
Droga B: 82 73 77 81 84 73
Droga C: 91 106 102 104 107 92

54
Estadística Analítica 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

Estadística descriptiva
Droga Variable n Media D.E.
A Concentración 6 94.83 7.47
B Concentración 6 78.33 4.72
C Concentración 6 100.33 7.06

Tabla 1 Tabla 3
Shapiro-Wilks (modificado) Análisis de la varianza
Variable n Media D.E. W* p (una cola) Variable N R² R² Aj CV
RE_Concentración 18 0,00 1,03 0,96 0,7830 Concentración 18 0,71 0,67 7,16
Cuadro de Análisis de la Varianza (SC tipo III)
Tabla 2 F,V, SC gl CM F
Análisis de la varianza – Test de Levene Modelo 1573,00 ….. ……. …..
Variable N R² R² Aj CV Droga 1573,00 ….. ……. …..
abs dif 18 0,02 0,00 91,27 Error …….. ….. …….
Cuadro de Análisis de la Varianza (SC tipo III) Total 2212,50 …..
F.V. SC gl CM F p-valor
Modelo 5,44 2 2,72 0,15 0,8649 Tabla 4
Droga 5,44 2 2,72 0,15 0,8649 Prueba de Kruskal Wallis
Error 278,67 15 18,58 Variable Droga N Medianas H p
Total 284,11 17 Concentración A 6 94,50 11,38 0,0033
Concentración B 6 79,00
Concentración C 6 103,00

A partir de los gráficos y las salidas correspondien-


tes, responda los siguientes ítems:

a) ¿Qué tipo de diseño se ha realizado? Justificar.


b) Expresar el modelo teórico correspondiente.
c) Especificar el factor en estudio y sus niveles.
d) Interpretar la observación resaltada.
e) Calcular e32 e interpretarlo en términos del pro-
blema.
f) Verificar en forma completa si se cumplen las
condiciones para un DCA modelo fijo paramétrico
g) Teniendo en cuenta lo decidido en el punto ante-
rior y que el nivel de significación es del 5%, realice
la prueba correspondiente.

CUESTIONARIO
1.- ¿Cuáles son las condiciones necesarias para un D.C.A. paramétrico? ¿Cómo puede verificarlas y/o
garantizarlas?

2.- ¿Cuáles son las condiciones necesarias para un D.C.A. de libre distribución (no paramétrico)? ¿Cómo
puede verificarlas y/o garantizarlas?

3.- En los problemas propuestos 2) y 3) indique:


Para el problema propuesto 2:
a) Factor en estudio: ..........................................................................................................................
b) Tratamientos: ................................................................................................................................
c) Unidad experimental: .....................................................................................................................
d) Observación: .................................................................................................................................
Para el problema propuesto 3:
a) Factor en estudio: ..........................................................................................................................
b) Tratamientos: ................................................................................................................................
c) Unidad experimental: .....................................................................................................................
d) Observación: .................................................................................................................................
55
Estadística Analítica 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

4.- En un DCA paramétrico, ¿por qué la región crítica es unilateral derecha?

5.- Indique el modelo teórico que se utilizan para el DCA paramétrico. Señale los parámetros del modelo
y sus estimadores.

56

También podría gustarte