Análisis de Varianza 1

Descargar como ppsx, pdf o txt
Descargar como ppsx, pdf o txt
Está en la página 1de 24

LISBETH A. RUIZ C.

ANÁLISIS DE
VARIANZA

1
Cuando en una investigación se tienen

1 2 3
Variables
Independientes
+ Con más de
dos niveles
diferentes
+ Comparación de
varias muestras

La probabilidad de encontrar diferencias significativas


simplemente por azar, aumenta a mayor número de comparaciones

2
El Análisis de Varianza

1
permite afrontar esta
situación. Hay varios
modelos según el número
y tipo de factores
El más simple es conocido como Análisis de Varianza de un solo factor

3
Análisis de Varianza

El análisis de Varianza consiste Análisis de Varianza de un solo factor


en la realización de un
contraste estadístico para Supongamos que disponemos de K
decidir entre las dos hipótesis:
Ho = α1 = α2 = …= αk = 0
grupos fijos (son los únicos con los
Ha = al menos un α1 es que cuenta la población) de modo
distinto de 0 que en el grupo i-ésimo hay ni
observaciones (caso no balanceado).

Donde: Sea la yij la j-ésima observación en el


µ = media global de las k muestras grupo i, éste se modela de la
αi = efecto del tratamiento y
representa la diferencia de la
siguiente manera:
media de este grupo con la media yij = µ + αi + Єij i = 1,2, … k
global αi = µi - µ
j = 1,2, … ni
Єij = cantidad aleatoria

4
Análisis de Varianza

Supuestos

5
Supuestos de aplicación

» Independencia
Con una adecuada aleatorización del experimento se garantiza la
independencia de las observaciones. Se puede comprobar con el
gráfico de los residuos realizado en el orden temporal en que se
recogieron los datos. Se pueden detectar correlaciones entre las
medidas residuales
» Linealidad (adecuación al modelo)
Cada uno de las observaciones puede descomponerse en varios
términos que están relacionados linealmente . Se comprueba con
el gráfico de dispersión de residuos versus valores ajustados
» Homocedasticidad (igualdad de varianzas)
Si este supuesto no se cumple, la prueba de F
del modelo balanceado con efectos fijo se ve poco
afectada. Se puede evitar con tamaños de muestras ANAVAR
iguales para todos los tratamientos
» Normalidad
Se puede verificar con la prueba de Kolmogorov-
Smirnov. Este modelo es poco afectado por este
supuesto

»Esfericidad
Se comprueba mediante el supuesto de homogeneidad
de varianzas. La prueba de Mauchly, es la que
comprueba estadísticamente la esfericidad. 6
2
Cálculo del estadístico F e
interpretación de
resultados

7
Dentro
del
Entre
grupo
grupos

Tabla de Análisis
de Varianza para
un factor fijo Variabilidad

Ediciones simultáneas en un solo documento.


Ya no tiene que esperar su turno ni
administrar varias versiones.

Lo importante es el trabajo en grupo y la co-


autoría le ayudará a conseguirlo.
8
Suma de cuadrados SCD es en realidad la varianza
de los valores yij respecto a la media global de
todas las muestras.
TABLA DE ANÁLISIS DE

El Cuadrado medio CMD estima la varianza de


las medias de cada muestra respecto a la
media global. Si la hipótesis nula fuese cierta,
estas dos varianzas serían aproximadamente
iguales, siendo las diferencias observadas
Se adopta esta regla de
pequeñas y debidas únicamente al error del
VARIANZA

decisión: Si el valor Fobs >


muestreo. Fαik-1, n-K se rechaza H0 con
nivel de significación α,
en caso contrario no se
El estadístico Fobs En el caso de ser > rechaza Ho
sigue la las ≠ entre los
distribución F con grupos a las ≠ dentro
K-1 y n-k grados de de los grupos, el
libertad valor de F será > 1
9
Diseño de experimento
Completamente aleatorizado (DCA)
Modelo lineal:
Yij = µ + τi + εij
I = 1,…,t;
t = número de tratamientos
J = 1,…,n
n = número de repeticiones por tratamientos
Donde:
µ = es el efecto medio
τi = es el efecto del i-ésimo tratamiento
Εij = error experimental

10
Diseño de experimento
Completamente aleatorizado (DCA)
Representación simbólica del Diseño Completamente Aleatorizado (DCA)

11
Diseño de experimento
Completamente aleatorizado (DCA)
Representación simbólica del Diseño Completamente Aleatorizado (DCA)
Estimaciones
Suma de cuadrados

Grados de libertad
(t-1)(r -1)

Cuadrado medio esperado


Se calcula multiplicando cada uno de los posibles valores de la variable por su
correspondiente probabilidad y el producto resultante es sumado

12
Diseño de experimento
Completamente aleatorizado (DCA)

Prueba de Hipótesis
Las hipótesis a probar son: H o: τ i = 0 H a: τ i ≠ 0
Para comprobar las hipótesis se usa la prueba de F que es la relación de dos
X2 (Chi Cuadrado) independientes divididos cada uno en sus respectivos
grados de libertad

13
Diseño de experimento
Completamente aleatorizado (DCA)
• Se tiene un DCA si y sólo si hay una asignación
aleatoria de los tratamientos a las UE.

14
Diseño de experimento
Completamente aleatorizado (DCA)
• Ventajas
– Flexibilidad: Cualquier número de tratamientos y cualquier número de repeticiones pueden
ser usadas, siempre y cuando se tengan suficientes UE homogéneas.
– Análisis Estadístico simple: El análisis estadístico es simple, ya sea cuando todos los
tratamientos tengan igual número de réplicas (balanceado), diferente número de réplicas
(desbalanceado) o pérdida de datos, caso en el cual se trata como un análisis desbalanceado.
– Máximo número de grados de libertad para el error: Esto ocurre porque el diseño tiene sólo
dos fuentes de variación que son los tratamientos y el error. Los grados de libertad para este
error vienen dados por la expresión t(r-1).
– Precisión: Es muy preciso si se tienen en cuenta UE homogéneas.
• Desventajas
– Se puede obtener baja precisión cuando las unidades experimentales no sean muy
homogéneas y así ser ineficiente.
• Usos
– Es recomendado cuando es posible que gran parte de las UE no respondan al tratamiento o
puedan perderse durante el experimento y en los que el número de UE es limitado, ya que
provee el máximo número de grados de libertad del error.

15
Aleatorización
La aleatorización es un procedimiento que permite: la validación del error
experimental, evita sesgos y garantiza la independencia de los errores. La
aleatorización puede realizarse por diferentes métodos

Método 1
Suponga que se tienen N=15 UE homogéneas, para un experimento bajo un DCA con t=3 y r=5. Marque las 15
UE con los números 1,2,…,15. Luego rotule unos papelitos con los números K=1,2,…15. Colóquelos en una
bolsa. Seleccione un papelito y márquelo por el reverso de donde está marcado con el número (1,1) deje este
papelito fuera de la bolsa. Continúe marcando (1,1),12,…15, 21,22…25….31,…35. Un papelito rotulado 5 y por
el reverso 1,1, la UE marcada con el número 5, recibirá el tratamiento 1 y será la réplica 1.

Método 2
Suponga que se tienen N=15 UE homogéneas, para un experimento bajo un DCA con t=3 y r=5. Marque las 15
UE con los números 1,2,…,15. Luego ubique la punta de su lápiz aleatoriamente en cualquier lugar de la tabla
de números aleatorios, por ejemplo, fila 26 columna 5 donde aparece el número 24878, a partir de los dos
primeros número desplácese hacia abajo por ejemplo y seleccione números de dos cifras que esten dentro
del rango de repeticiones y tratamientos.

Método 3
Puede usar la opción de generación de números aleatorios de cualquier dispositivo. En excel pueden buscar la
función: aleatorio. Ejemplo: 0,25083994. Marcarían el la primera UE con el tratamiento 2 y la repetición 3. Así
sucesivamente hasta marcar todas las UE 16
Ejercicio de Diseño de experimento
Completamente aleatorizado (DCA)
Como parte de la investigación del derrumbe del techo de un edificio, un laboratorio prueba a
todos los pernos disponibles que conectaban la estructura de acero en tres distintas posiciones del
techo. Las fuerzas requeridas para cortar cada uno de los pernos (valores codificados) son las
siguientes:
Posición 1: 90, 82, 79, 98, 83, 91
Posición 2: 105, 89, 93, 104, 89, 95, 86
Posición 3: 83, 89, 94
Efectúese análisis de varianza para probar con un nivel
de significación de 0,05 si las diferencias entre las medias
muestrales en las tres posiciones son significativas

17
Ejercicio de Diseño de experimento
Completamente aleatorizado (DCA)

t-1

t(n-1)
234,452381/2

117.22619/50.2534014

18
19
Ejercicio de Diseño de experimento
Completamente aleatorizado (DCA)

1. Supongamos que usted es un nutriólogo a quien se le ha pedido determine si existe


una diferencia en el contenido de azúcar de las tres principales marcas de cereal para el
desayuno (A, B y C). Para evaluar la cantidad de azúcar que contienen los cereales, usted
selecciona una muestra aleatoria de seis paquetes de cada marca y lleva a cabo un
examen químico del contenido de azúcar de cada uno. Así midió los siguientes gramos de
azúcar:
Cereal para el desayuno
A B C Determine si alguna de las marcas tiene un contenido de
5 1 7 contenido de azúcar diferente. Utilice α =0,05
4 5 3
7 3 4
3 6 5
2 4 7
5 7 8

20
Ejercicio de Diseño de experimento
Completamente aleatorizado (DCA)
2. Un investigador realiza un experimento para determinar si la pérdida del sueño afecta
la capacidad para mantener constante la atención. Quince individuos son divididos de
manera aleatoria entre los siguientes tres grupos de 5 sujetos cada uno: el grupo 1, que
duerme de manera normal ( de 7 a 8 horas); el grupo 2, que no duerme durante 24 horas,
y el grupo 3, que no duerme durante 48 horas. A los tres grupos se les somete a la misma
prueba de percepción auditiva, la cual consiste en hacerlos oír tonos de medio segundo a
intervalos irregulares durante una hora. En ciertas ocasiones, un tono es ligeramente más
corto que los demás. La tarea del sujeto consiste en detectar los tonos más cortos. Así se
observaron los siguientes porcentajes de percepciones correctas:
Sueño Sin dormir durante Sin dormir durante
normal 24 horas 48 horas Determine si existe un efecto
85 60 60 global por privación del sueño.
83 58 45 Utilice las ecuaciones conceptuales
76 75 38 del análisis de varianza de un
64 52 48 factor. Utilice α=0,01
75 63 50
21
Ejercicio de Diseño de experimento
Completamente aleatorizado (DCA)
3)Para verificar si la memoria cambia con la edad, un investigador realiza un experimento en el cual
participan cuatro grupos de seis sujetos cada uno. Los grupos difieren en cuanto a la edad de los
sujetos. En el grupo 1, los sujetos tienen 30 años; en el grupo 2 tienen 40 años; en el grupo 3 tienen
50 años; y en el grupo 4 tienen 60 años. Suponga que todos los sujetos gozan de buena salud y que
los grupos concuerdan en otras variables importantes, tales como la escolaridad, el CI, el género, la
motivación, y así sucesivamente. Se muestra a cada sujeto una serie de sílabas sin sentido (una
combinación de tres letras sin significado, como DAF o FUM) a razón de una sílaba cada 4 segundos.
La serie se muestra dos veces, después de lo cual se pide a los sujetos que escriban el mayor número
posible de sílabas que sean capaces de recordar. El número de sílabas que logró recordar cada sujeto
se presenta en la siguiente tabla:
30 años 40 años 50 años 60 años
12 12 17 13
14 16 14 10 Determine si la edad tiene algún
14 16 14 7 efecto sobre la memoria.
17 11 9 8 Utilice α=0,01
15 13 11 6
10 18 15 9
22
Ejercicio de Diseño de experimento
Completamente aleatorizado (DCA)

4)Supongamos que usted es contratado por un servicio de evaluación de productos y que debe
evaluar acumuladores para automóvil. En esta parte del estudio, usted quiere determinar si existe
una diferencia de la vida útil de los mejores acumuladores de tres fabricantes (A, B y C). Como base
de su evaluación, usted selecciona una muestra aleatoria de cuatro acumuladores de cada fabricante
y les aplica pruebas de laboratorio, las cuáles le permitirán determinar la vida útil de cada uno. En la
siguiente tabla se presentan los resultados, en términos de meses de vida útil de los acumuladores:
Fabricantes del acumulador
A B C
50 46 44
57 52 63
53 57 50
59 50 51

Determine si la edad tiene algún efecto sobre la memoria. Utilice α=0,01

23
24

También podría gustarte