7 - MCAAD - ANOVA Factoriala

Descărcați ca pptx, pdf sau txt
Descărcați ca pptx, pdf sau txt
Sunteți pe pagina 1din 45

ANOVA FACTORIALA

Scopul
• Scopul acestei tehnici de analiză este să testeze dacă diferenţele
dintre mediile grupurilor sunt semnificative atunci când avem
două sau mai multe variabile independente.

• În cursul anterior ANOVA a fost folosită atunci când am studiat


efectul unei variabile independentă – factorul – asupra unei
variabile dependente.
• Această metodă este folositoare dacă vrem să vedem efectul mai
multor variabile independente (mai mulţi factori) şi, mai ales,
efectul de interacţiune.
Întrebarea de cercetare
• ANOVA factorială este folosită pentru a vedea dacă există
o diferență semnificativă între mediile unei variabile
dependente în cazul în care avem două sau mai multe
variabile independente.
• Avem o variabilă continuă, denumită
– Variabila dependentă
– Criterion variable
– Outcome variable (variabila rezultat)
– Response variable (variabilă răspuns)

Ex: notele la test


• Avem 2 variabile de grupare, cunoscute ca şi:
– Factori
– Variabile Independente
– Predictori
– Variabile de grupare
– Variabile de clasificare
Design 2 x 2
• Variabila A are 2 nivele (ex: gen - bărbat, femeie); variabila
B are tot 2 nivele (ex: rasa: albi si ceilalti).
=> 4 situaţii, fiecare combinaţie este “o celulă”.
Design 2 x 3
• variabila B are 3 nivele (ex: rasa: albi, negri si ceilalti).
=> 6 situaţii, fiecare combinaţie este “o celulă”.
Pentru exemplul nostru:
DESIGN 2x3
Race of Respondent
Total
White Black Other
Respondent's Sex Male 100.0%
85.7% 11.2% 3.1%

Female 81.6% 15.1% 3.3% 100.0%


Total
83.3% 13.4% 3.2% 100.0%
Întrebarea de cercetare
• Există o diferenţă de prestigiu ocupational între barbati şi
femei?
• Există o diferenţă de prestigiu ocupational între rase?
Ipoteze nule: (sunt 2!!)
• Nu există o diferenţă de prestigiu ocupational între barbati şi
femei
• Nu există o diferenţă de prestigiu ocupational între rase

…de fapt sunt mai multe intrebari de cercetare


Există un alt posibil efect: interacţiunea
• există posibilitatea ca pe lângă aceste efecte să avem un al treilea posibil efect:
efectul de interacțiune. De exemplu, prestigiul ocupațional al femeilor poate fi
mai scăzut decât cel al bărbaților, dar pentru alte rase (decât cea alba) poate fi
invers.

• Ipoteza 3: exista un efect de interacțiune între variabilele independente in


influenta pe care o au asupra variabilei dependente

• Ex de ipoteza nula: nu exista efecte semnificative de interacțiune intre


variabilele gen si rasa asupra prestigiului occupational.
• Complexitate: daca mai introducem o a 3 variabila independenta: categoria
ocupațională
Exemple: efecte de interactiune

• "Exercise positively moderates the positive relationship


between diet and weight loss"
• "Exercise amplifies the positive relationship between diet
and weight loss"
• "TV time negatively moderates (dampens) the positive
relationship between diet and weight loss"
Cu Dieta
6 • Indivizii ce țin dietă: scăderea
5 cu 3 sau 5 kg, în medie, dacă
4
nu fac exerciții, respectiv dacă
3
fac
2

0
Cu exercitii Fara exercitii

Fara Dieta
0
Cu exercitii Fara exercitii
• Indivizii ce NU țin dietă:
-0.5
creșterea cu 2 sau 1 kg dacă
-1
fac exerciții, respectiv dacă nu
-1.5
fac
-2

-2.5
Kilograme scăzute

Cu Dieta Fara Dieta


-1

-2

Cu exercitii Fara exercitii

• Disclaimer: caz fictiv!


• Efectul de interacțiune!
Grafice folosite pentru a exemplifica interacțiunile

30

20 no barb.
one barb.

10

0
no alch. one alch

Interpretare: Nu există interacțiune (liniile sunt paralele)


40

30
no barb.
20 one barb.

10

0
no alch. one alch.

Interpretare: există “ceva” interacțiune (liniile nu sunt paralele), dar


nici nu se intersectează
30

20 no barb.
one barb.

10

0
no alch. one alch

Exista o interactiune semnificativă: liniile se


intersecteaza
• Exemplu: 1991 US GSS

• Prestigiul ocupational = variabila dependentă

• Factori:
– Sexul (B, F)
– Rasa (albi, negri, alta)
• Interacțiune posibilă:
– Gen* rasa
Nu putem folosi mai multe ANOVA?

• Din cauza ca lucram de mai multe ori cu acelasi set de date exista
riscul de a creste pe alpha (de a face erori de rangul I)
• Acest risc este controlabil: Bonferroni correction
• Sau putem combina cele 2 (3, 4, …) variabile independente si
construi o singura variabila cu k1*k2*… clase (ex: femeie alba
ocupata, ...)
• DAR – motivul cel mai important pentru care folosim ANOVA
factorial este posibilitatea de a studia interacțiunile.
Factorial ANOVA in SPSS
Comanda in SPSS

Analyze menu - General Linear Model - Univariate.


in Dependent – asezam variabila dependenta,
Ambele variabile independent le punem la Fixed Factor(s)
Options - Homogeneity tests, si DESCRIPTIVES - Continue.

Plots punem Genul pe separate lines si rasa la Horizontal Axis


Click pe Add apoi Continue.
Post Box – click pe rasa si o asezam in fereastra pt Post Hoc tests
From the Equal variance assumed alegem Bonferroni.

Continue si apoi OK.


Sintaxa:

UNIANOVA
prestg80 BY sex race
/METHOD = SSTYPE(3)
/INTERCEPT = INCLUDE
/POSTHOC = race ( BTUKEY )
/PLOT = PROFILE( race*sex )
/PRINT = DESCRIPTIVE HOMOGENEITY
/CRITERIA = ALPHA(.05)
/DESIGN = sex race sex*race .
Descriptive Statistics

Dependent Variable: R's Occupational Prestige Score (1980)


Respondent's Sex Race of Respondent Mean Std. Deviation N
Male White 44.99 13.197 535
Black 34.95 10.603 66
Other 42.85 12.696 20
Total 43.85 13.278 621
Female White 42.92 12.955 667
Black 38.60 12.090 108
Other 38.68 10.440 22
Total 42.22 12.864 797
Total White 43.84 13.098 1202
Black 37.22 11.653 174
Other 40.67 11.617 42
Total 42.93 13.067 1418
Levene's Test of Equality of Error Variancesa

Dependent Variable: R's Occupational Prestige Score (1980)


F df1 df2 Sig.
1.924 5 1412 .088
Tests the null hypothesis that the error variance of
the dependent variable is equal across groups.
a. Design: Intercept+SEX+RACE+SEX * RACE

• Sig=0.088 > 0.05, deci asumptia de


egalitate a varianțelor este indeplinita
Tests of Between-Subjects Effects

Dependent Variable: R's Occupational Prestige Score (1980)


Type III Sum
Source of Squares df Mean Square F Sig.
Corrected Model 8886.142 a 5 1777.228 10.766 .000
Intercept 479147.035 1 479147.035 2902.680 .000
SEX 54.460 1 54.460 .330 .566
RACE 7632.679 2 3816.340 23.119 .000
SEX * RACE 1255.778 2 627.889 3.804 .023
Error 233079.627 1412 165.071
Total 2855770.000 1418
Corrected Total 241965.769 1417
a. R Squared = .037 (Adjusted R Squared = .033)

• Efectele principale:
– SEX: sig=0,566
– RASA sig=0,000
+ INTERACTIUNEA
Respondent's Sex * Race of Respondent

Dependent Variable: R's Occupational Prestige Score (1980)


95% Confidence Interval
Respondent's Sex Race of Respondent Mean Std. Error Lower Bound Upper Bound
Male White 44.989 .555 43.899 46.078
Black 34.955 1.581 31.852 38.057
Other 42.850 2.873 37.214 48.486
Female White 42.919 .497 41.943 43.895
Black 38.602 1.236 36.177 41.027
Other 38.682 2.739 33.308 44.055

• Barbati • Femei
– albi – albe
– negri – negrese
– alta – alta
R's Occupational Prestige Score (1980)
a,b,c
Tukey B
Subset
Race of Respondent N 1 2
Black 174 37.22
Other 42 40.67 40.67
White 1202 43.84
Means for groups in homogeneous subsets are displayed.
Based on Type III Sum of Squares
The error term is Mean Square(Error) = 165.071.
a. Uses Harmonic Mean Sample Size = 98.721.
b. The group sizes are unequal. The harmonic mean of
the group sizes is used. Type I error levels are not
guaranteed.
c. Alpha = .05.

• Diferente semnificative intre albi si negri – ceilalti sunt grup tranzitoriu (nu sunt
semnificativ diferiti nici de albi, nici de negri)
Avem interacțiune!
Estimated Marginal Means of R's Occupational Prestige Score (1980)
46

44

42
Estimated Marginal Means

40

38
Respondent's Sex
36
Male

34 Female
White Black Other

Race of Respondent
Respondent's Sex * Race of Respondent

Dependent Variable: R's Occupational Prestige Score (1980)


95% Confidence Interval
Respondent's Sex Race of Respondent Mean Std. Error Lower Bound Upper Bound
Male White 44.989 .555 43.899 46.078
Black 34.955 1.581 31.852 38.057
Other 42.850 2.873 37.214 48.486
Female White 42.919 .497 41.943 43.895
Black 38.602 1.236 36.177 41.027
Other 38.682 2.739 33.308 44.055

• Femeile au prestigiu ocupational mai mic decat barbatii


(dif=1 pct – diferenta nesemnificativa)
DAR
femeile negre au prestigiu ocupațional mai ridicat decât
bărbații negri
• Daca am fi facut o ANOVA cu 6 categorii:
-> lipseste efectul interactiunii
• Concluzia posibilă: rasa e mai importanta decat genul in a
explica diferențieri sociale. Dar combinația rasă și gen e
mai valoroasă pentru explicații (vezi F. Anthias, 2001)
• Rezultatul testului t vs. ANOVA factorial:
are genul un efect semnificativ?
• GLM în PSPP:
• Analyze -
Univariate
• Analiza GLM în
PSPP nu are
opțiuni și oferă
doar un singur
rezultat 
GLM in JASP
• Folosim tot ANOVA
• La fixed factors adaugam cei doi factori ce ne
intereseaza: rasa si genul.
• La display bifam descriptives statistics
• Assumptions checks – homogeneity tests
• Descriptives plots: rasa la Horizontal axis; sex pentru
Separate Lines
II.
Repeated-Measures ANOVA in
SPSS
(rANOVA) a.k.a GLM – repetead
measures
• Varianța este ÎN subiecți nu ÎNTRE subiecți (within
subjects și nu between subjects)
• Ex: variație în timp, rezultate diferite la măsurări
repetate
Asumpții

1. Normalitate: pt fiecare nivel al măsurării VD trebuie să aibă o distribuție


normală
2. Sfericitate: Diferența între două nivele de măsurare trebuie să aibă aceeași
varianță ca și diferența între alte nivele
3. Aleatoare: cazurile trebuie să provină dintr-un eșantion aleator iar scorurile
participanților trebuie să fie independente
! Masuratorile repetate (ale aceluiasi subiect) nu sunt independente.
Multivariate Testsb

Effect Value F Hypothesis df Error df Sig.


TRIAL Pillai's Trace .985 127.686 a 3.000 6.000 .000
Wilks' Lambda .015 127.686 a 3.000 6.000 .000
Hotelling's Trace 63.843 127.686 a 3.000 6.000 .000
Roy's Largest Root 63.843 127.686 a 3.000 6.000 .000
TRIAL * ANXIETY Pillai's Trace .756 6.183 a 3.000 6.000 .029
Wilks' Lambda .244 6.183 a 3.000 6.000 .029
Hotelling's Trace 3.091 6.183 a 3.000 6.000 .029
Roy's Largest Root 3.091 6.183 a 3.000 6.000 .029
TRIAL * TENSION Pillai's Trace .639 3.546 a 3.000 6.000 .088
Wilks' Lambda .361 3.546 a 3.000 6.000 .088
Hotelling's Trace 1.773 3.546 a 3.000 6.000 .088
Roy's Largest Root 1.773 3.546 a 3.000 6.000 .088
TRIAL * ANXIETY Pillai's Trace .672 4.099 a 3.000 6.000 .067
* TENSION Wilks' Lambda .328 4.099 a 3.000 6.000 .067
Hotelling's Trace 2.050 4.099 a 3.000 6.000 .067
Roy's Largest Root a
2.050 4.099 3.000 6.000 .067

a. Exact statistic
b.
Design: Intercept+ANXIETY+TENSION+ANXIETY * TENSION
Within Subjects Design: TRIAL
Mauchly's Test of Sphericityb

Measure: MEASURE_1

a
Epsilon
Approx. Greenhous
Within Subjects Effect Mauchly's W Chi-Square df Sig. e-Geisser Huynh-Feldt Lower-bound
TRIAL .187 11.254 5 .049 .536 .902 .333
Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is
proportional to an identity matrix.
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the
Tests of Within-Subjects Effects table.
b.
Design: Intercept+ANXIETY+TENSION+ANXIETY * TENSION
Within Subjects Design: TRIAL
Tests of Within-Subjects Effects

Measure: MEASURE_1
Type III Sum
Source of Squares df Mean Square F Sig.
TRIAL Sphericity Assumed 991.500 3 330.500 152.051 .000
Greenhouse-Geisser 991.500 1.608 616.432 152.051 .000
Huynh-Feldt 991.500 2.707 366.284 152.051 .000
Lower-bound 991.500 1.000 991.500 152.051 .000
TRIAL * ANXIETY Sphericity Assumed 8.417 3 2.806 1.291 .300
Greenhouse-Geisser 8.417 1.608 5.233 1.291 .300
Huynh-Feldt 8.417 2.707 3.109 1.291 .301
Lower-bound 8.417 1.000 8.417 1.291 .289
TRIAL * TENSION Sphericity Assumed 12.167 3 4.056 1.866 .162
Greenhouse-Geisser 12.167 1.608 7.564 1.866 .197
Huynh-Feldt 12.167 2.707 4.495 1.866 .169
Lower-bound 12.167 1.000 12.167 1.866 .209
TRIAL * ANXIETY Sphericity Assumed 12.750 3 4.250 1.955 .148
* TENSION Greenhouse-Geisser 12.750 1.608 7.927 1.955 .185
Huynh-Feldt 12.750 2.707 4.710 1.955 .155
Lower-bound
12.750 1.000 12.750 1.955 .200

Error(TRIAL) Sphericity Assumed 52.167 24 2.174


Greenhouse-Geisser 52.167 12.868 4.054
Huynh-Feldt 52.167 21.655 2.409
Lower-bound 52.167 8.000 6.521
Tests of Within-Subjects Contrasts

Measure: MEASURE_1
Type III Sum
Source TRIAL of Squares df Mean Square F Sig.
TRIAL Linear 984.150 1 984.150 247.845 .000
Quadratic 6.750 1 6.750 3.411 .102
Cubic .600 1 .600 1.051 .335
TRIAL * ANXIETY Linear 1.667 1 1.667 .420 .535
Quadratic 3.000 1 3.000 1.516 .253
Cubic 3.750 1 3.750 6.569 .033
TRIAL * TENSION Linear 10.417 1 10.417 2.623 .144
Quadratic .083 1 .083 .042 .843
Cubic 1.667 1 1.667 2.920 .126
TRIAL * ANXIETY Linear 9.600 1 9.600 2.418 .159
* TENSION Quadratic .333 1 .333 .168 .692
Cubic 2.817 1 2.817 4.934 .057
Error(TRIAL) Linear 31.767 8 3.971
Quadratic 15.833 8 1.979
Cubic 4.567 8 .571

S-ar putea să vă placă și