Probleme Rezolvate Bazele Econometriei
Probleme Rezolvate Bazele Econometriei
Probleme Rezolvate Bazele Econometriei
Problema 1
Un produs a fost propus spre vânzare pe 20 de pieţe (zone geografice) la preţuri diferite, cu
venituri (medii) ale consumatorilor diferite, înregistrându-se valori diferite ale cererii pentru
fiecare piaţă.
Tabelul 1
Nr. crt. Cerere Venit Nr. crt. Cerere Venit
1) În ipoteza unui model liniar simplu între cerere şi venit, să se estimeze parametrii
acestuia, să se interpreteze, să se scrie ecuaţia modelului şi să se reprezinte grafic.
Rezolvare:
1) Un grafic adecvat, de exemplu norul de puncte permite evidenţierea legăturii dintre cele
două variabile:
20
18
16
14
12
cerere (Y)
10
0
400 500 600 700 800 900 1000 1100
venit (X1)
1 20
y yt 12,535
20 t 1
1 20
x xt 791,65
20 t 1
20
(x
t 1
t x ) 2 435358,6
20
(x
t 1
t x )( yt y ) 3396,345
20
cov( x, y ) (x t x )( yt y )
aˆ1 t 1
0,007801
x2 20
(x
t 1
t x) 2
â0 (constanta) – reprezintă nivelul mediu al variabilei y când nivelul variabilei x este
zero. În acest exemplu, la un venit al consumatorilor egal cu zero cererea medie este
6,3591.
â1 (coeficientul de regresie) – arată cu cât se modifică în medie y la modificarea cu o
unitate a lui x. Dacă valoarea lui â1 este pozitivă înseamnă că legătura dintre x şi y este
una directă ; în caz contrar, legătura este una inversă. În acest exemplu, interpretarea
coeficientului de regresie este următoarea : la o creştere sau scădere a venitului
consumatorului cu o unitate, ne aşteptăm ca cererea să crească sau să scadă în medie
cu 0,007801 unităţi.
Ecuaţia modelului va fi : yˆt 6,359 0,0078 xt
Pentru a reprezenta grafic ecuaţia modelului avem nevoie de coordonatele a două puncte.
Pentru a simplifica calculele, vom determina punctele de intersecţie cu axele :
x 0 y 6,359 - punctul A (0 ;6,359)
y 0 x 815,256 - punctul B (-815,256 ;0)
ˆ1 0,72 - în cazul primului consumator, cererea este mai mică cu 0,72 decât cererea medie
înregistrată la consumatorii cu acelaşi nivel al venitului (777 unităţi monetare) din cauza altor
factori.
ˆ t
2
178,348
ˆ 2 t 1
9,9082 - dispersia lui y datorată altor factori
T 2 20 2
ˆ 9,9082 3,15 - cererea se abate în medie de la mediile condiţionale cu 3,15 sub
influenţa altor factori
T
x 2
t
12969553
5) Varianţa estimată a lui â0 : ˆ a2ˆ0 t 1
ˆ 2 9,9082 14,7585
T
20 435358,6
T ( xt x ) 2
t 1
şi respectiv eroarea standard ˆ aˆ0 14.7585 3,841681 - valorile lui â0 se abat în medie de
la a0 cu 3,841681
ˆ 2 9,9082
Varianţa estimată a lui â1 : ˆ a2ˆ1 T
0,000022759
(x
435358,6
t x)2
t 1
aˆ1
dacă t aˆ1 t n0,05
2 respingem ipoteza H 0 , coeficientul a1 este semnificativ diferit de 0
ˆ aˆ1
(acceptăm a1 0 ), venitul este deci o variabilă explicativă pentru cerere.
aˆ1
dacă t aˆ1 t n0,05
2 acceptăm ipoteza H 0 , coeficientul a1 nu este semnificativ diferit de
ˆ aˆ1
0 (acceptăm a1 0 ), venitul nu este deci o variabilă explicativă pentru cerere.
Calculăm:
aˆ1 0,007801
t aˆ1 1,64
ˆ aˆ1 0,0047706
0, 05
t18 2,101
t aˆ1 t18
0, 05
ceea ce înseamnă că din punct de vedere statistic, a1 0 .
Acelaşi demers se poate urma şi pentru coeficientul a0 , dar vom lăsa calculele la latitudinea
cititorului.
( yˆ y ) 2 t
2
R2 t 1
T
1 T
t 1
( y y)
t 1
2
( y y)
t 1
2
Total 20 20-1
SPT ( yt y ) 2 204,845
t 1
(x t x)2
435358,6
x2 t 1
21767,93
20 20
20
( y t y)2
204,845
y2 t 1
10,24225
20 20
Plecând de la relaţia de mai sus şi înlocuind â1 cu formula sa de calcul, se poate arăta că în
cazul modelului liniar simplu coeficientul de determinaţie este egal cu coeficientul de
corelaţie liniară simplă ridicat la pătrat :
xy
2
xy2
2 x2 2
ˆ 2
2
x2 xy
R2 1 2 x x
a 2 , unde este coeficientul de corelaţie
y y2 y2 x y
T
(x t x )( yt y )
liniară simplă : xy xy t 1
, iar xy este cov(x,y)
x y T T
(x
t 1
t x ) ( yt y )
2
t 1
2
Coeficientul de determinaţie ajustat ţine cont de gradele de libertate şi are relevanţă mai ales
T în cazul modelului liniar multiplu
t
2
/(T k )
T 1
R 1 T
2 t 1
1 (1 R 2 )
T k
( y y ) 2 /(T 1)
t 1
Înlocuind numeric vom obţine întotdeauna o valoare mai mică decât cea a lui R 2 :
178,349 /( 20 2) 20 1
R 2 1 1 (1 0,1293) 0,08093
204,845 /( 20 1) 20 2
1 (600 791,65) 2
ˆ y2 9,9082
t 1
1,3313 de unde rezultă că ˆ yt 1 1,1538
20 435358,6
Intervalul de încredere pentru yt 1 se scrie:
Prob yˆ t 1 tT2ˆ yt 1 yt 1 yˆ t 1 tT2ˆ yt 1 1
ceea ce pentru o probabilitate de 95% devine:
Prob11,0396 2,09 1,1538 yt 1 11,0396 2,09 1,1538 95%
Prob8,6281 yt 1 13,4511 95%
Problema a fost rezolvată până aici într-o manieră didactică, cu calcule făcute fără a utiliza
programe informatice de specialitate. Prin software-ul Eviews, de exemplu, toate aceste
rezultate sunt furnizate imediat. Informaţiile de bază redate pentru o regresie simplă, fără a
utiliza opţiuni suplimentare sunt următoarele:
În prima parte a tabelului, prima coloană declară variabilele exogene care se regăsesc în
regresie (în exemplul nostru, C=constanta, X=variabila venit), pe cea de-a doua coloană sunt
estimaţiile punctuale ale parametrilor din model (calculate la subpunctul 1), pe cea de-a treia
coloană sunt erorile de estimare ale parametrilor (calculate la subpunctul 5), iar pe ultimele 2
coloane avem statistica calculată Student şi riscul de nulitate al parametrilor (calculate la
subpunctul 6).
În cea de-a doua parte a tabelului avem valorile calculate ale coeficientului de determinaţie,
coeficientului de determinaţie ajustat (calculate la subpunctul 8), eroarea standard a regresiei,
care este de fapt abaterea medie pătratică a reziduurilor, suma pătratelor reziduurilor
(calculate la subpunctul 4), testul F cu probabilitatea asociată (calculat la subpunctul 9), media
şi abaterea medie pătratică a variabilei dependente y.
Tabelul de mai sus transpus cu notaţiile pe care le-am folosit are următoarea formă (pentru
fiecare notaţie, formulele au fost prezentate pe parcursul rezolvării):
C â0 ˆ a
0
t â0
X â1 ˆ a
1
t â1
F-statistic F
Prob(F-statistic)
Problema 2
Un analist este interesat de relaţia dintre cheltuielile cu resursa umană (x) si profitul net (y) a
unor companii din domeniul distribuţiei de produse de larg consum. Acesta extrage aleator un
eşantion de 40 companii, iar în urma prelucrării datelor obţine urmatoarele rezultate:
̅ şi ̅ ;̂
2) Ştiind că valoarea tabelată Student pentru un anumit prag de risc este 2, să se testeze
dacă coeficientul de regresie diferă semnificativ de 1,2.
Rezolvare:
y2 cov( x, y )
1) Matricea de variaţie şi covariaţie dintre y şi x are forma
cov( x, y ) x2
cov( x, y) 2611312
aˆ1 0,884
2
x 2954194
aˆ0 y aˆ1 x 3878,179 (0,884) 5146,34 8427,544
Interpretare parametrii :
â0 (constanta) – la un nivel al cheltuielilor cu resursa umană egal cu zero, profitul net
mediu este 8427,544 mii lei.
â1 (coeficientul de regresie) –la o creştere sau scădere a cheltuielilor cu resursa umană
cu o unitate, ne aşteptăm ca profitul net să scadă sau să crească în medie cu 0,884
unităţi (relaţie inversă între variabile deoarece semnul coeficientului este negativ).
Ecuaţia modelului va fi : yˆ t 8427,544 0,884 xt
Pentru a reprezenta grafic ecuaţia modelului avem nevoie de coordonatele a două puncte. Pentru a
simplifica calculele, vom determina punctele de intersecţie cu axele :
x 0 y 8427,544 - punctul A (0 ; 8427,544)
y 0 x 9534,134 - punctul B (9534,134 ;0)
H 0 : a1 1,2
2) Formulăm ipoteza nulă, cu alternativa ei:
H 1 : a1 1,2
(x t x)2 T
x2 t 1
( xt x ) 2 T x2 40 2954194 118167760
T t 1
1 (4000 5146,34) 2
ˆ y2 254065
t 1
9176,978 de unde rezultă că ˆ yt 1 95,7965
40 118167760
Prob4891,544 2 95,7965 yt 1 4891,544 2,09 95,7965 1
Prob4699,951 yt 1 5083,137 1
Aşadar, la un nivel al cheltuielilor cu resursa umană de 4000, profitul net se situează în
intervalul 4699,951;5083,137cu o probabilitate de garantare de 1 (sau cu un prag de risc
)
Problema 3
Un eşantion de 15 ţări din America Centrală şi de Sud este observat în raport cu venitul
net/locuitor (y – exprimat în sute de dolari) şi ponderea agriculturii în economie (x – exprimat
în procente). In ipoteza unui model econometric liniar între cele 2 variabile, se cunosc
umătoarele informaţii:
15 15 15 15
y
i 1
i 458, x
i 1
i 165, (x
i 1
i x ) 2 442 , ( yi y ) 2 5859,73 ,
i 1
15 15
(x
i 1
i x )( yi y ) 1149, ˆ
i 1
i
2
2872,85
Se cere:
Rezolvare:
15
cov( x, y )
(x i x )( y i y )
1149
1) aˆ1 i 1
2,599
2 15
(x
442
x
i x)2
t 1
aˆ 0 y aˆ1 x
y i
aˆ1
x i
458
(2,599)
165
59,12
n n 15 15
Interpretare parametri :
2) yˆ / x 12 59,12 2,599 12 27,93 - în medie, venitul net/locuitor al unei ţări care are o
pondere a agriculturii în economie de 12% este 2793 dolari.
ˆ t
2
2872,85
ˆ 2 i 1
220,98
n2 15 2
ˆ 2 220,98
Varianţa estimată a lui â1 : ˆ a2ˆ1 T
0,49
(x
442
t x)2
t 1
şi respectiv eroarea standard : ˆ aˆ 0,49 0,7 - valorile lui â1 se abat în medie de la
1
a1 cu 0,7.
Testarea semnificativităţii coeficientului de regresie :
H 0 : a1 0 aˆ1 a1 2,599 0
t aˆ1 3,71
H 1 : a1 0 ˆ aˆ1 0,7
t 2
t aˆ1 t ceea ce înseamnă că din punct de vedere statistic, a1 0 (se acceptă ipoteza H 1 , x îl
influenţează pe y)
Intervalul de încredere: Probaˆ1 t ˆ aˆ1 a1 aˆ1 t ˆ aˆ1 1
Prob 2,599 2 0,7 a1 2,599 2 0,7 1
Prob- 3,99 a1 -1,19 1
Seminificaţia intervalului de încredere : adevărata valoare a coeficientului de regresie se
situează în intervalul [-3,99; -1,19] cu o probabilitate de garantare de de 1 (sau cu un prag
de risc ).
aˆ12 x2
4) Pentru a calcula coeficientul de determinaţie folosim formula : R 2
y2
n n
( xi x ) 2 442
(y i y) 2
5859,73
x2 i 1
29,47 ; y2 i 1
390,65
n 15 n 15
aˆ12 x2 (2,599) 2 29,47
Înlocuind apoi în formula lui R 2 obţinem: R 2 0,51 - 51% din
y2 390,65
variaţia lui y este explicată de variaţia lui x prin intermediul acestui model.
Modelul liniar multiplu
Problema 1
Tabelul 1
Nr. yt x1t x2 t x3 t Nr. yt x1t x2 t x3 t
crt. crt.
1 163 669 17,4 69 13 295 869 10,3 67
2 381 872 10,5 75 14 256 824 17,5 88
3 455 1191 14,3 64 15 309 676 13,0 64
4 451 933 12,5 85 16 286 885 13,2 67
5 373 668 15,3 90 17 379 1179 11,8 60
6 321 733 13,8 61 18 425 1161 13,9 86
7 316 933 15,0 85 19 404 1074 11,5 64
8 410 1165 10,7 74 20 330 775 16,0 89
9 348 932 8,2 70 21 354 752 8,9 76
10 383 840 8,1 66 22 384 740 15,1 85
11 386 901 12,0 87 23 233 590 9,3 62
12 163 669 17,4 64
Se cere:
1) În ipoteza unei legături liniare multiple dintre yt şi factorii x1t , x2t , x3t să se
calculeze estimatorii parametrilor, să se interpreteze aceştia şi să se scrie ecuaţia
modelului.
y1 163
y 2 381
Y unde T 23 .
... ...
y 233
T
aˆ ( X ' X ) 1 X ' Y
1
1 1 ... 1 1 669 17,4 69 1 1 ... 1 163
669 872 ... 590 1 872 10,5 75 669 872 ... 590 381
aˆ
17,4 10,5 ... 9,3 ... ... ... ... 17,4 10,5 ... 9,3 ...
69 75 ... 62 1 590 9,3 62 69 75 ... 62 233
20,530
0,2643
â
- 11,065
3,1281
Estimatorii parametrilor sunt deci:
aˆ0 20,530
aˆ1 0,2643
aˆ2 11,065
aˆ3 3,1281
Interpretare parametri :
ˆ1 57,65 - în cazul primei unităţi statistice, valoarea variabilei y este mai mică cu 57,65
decât valoarea medie a lui y medie înregistrată la unităţile statistice cu acelaşi nivel al
variabilelor x1t , x2t , x3t din cauza altor factori.
3) Dispersia modelului este dispersia reziduurilor care se calculează folosind formula de
calcul a dispersiei şi ţinând cont de faptul că media reziduurilor este egală cu zero :
' 1 23
1 23 2
ˆ 2 t 19
T k 1 T k 1 t 1
2
t 1
t
1
1 1 ... 1 1 669 17,4 69
ˆ ˆ ˆ ( X ' X ) 2494,055
669 872 ... 590 1 872 10 ,5 75
2 1
a
17,4 10,5 ... 9,3 ... ... ... ...
69 75 ... 62 1 590 9,3 62
lui a 3 cu 1,072.
5) Pentru a testa seminificativitatea parametrilor la nivel individual vom folosi testul Student.
H 0 : ak 0
Formulăm o ipoteză nulă, cu alternativa ei:
H 1 : ak 0
Dacă valoarea absolută calculată a testului este mai mare decât valoarea teoretică
corespunzătoare, atunci se acceptă ipoteza alternativă. Pentru toate testele cu privire la câte un
parametru, vom avea următoarea valoarea teoretică a testului
tTk 1 t 23
0, 05
2,093
Pentru parametrul a0 :
aˆ 0 20,53
t 0,21 2,093 - acceptăm că a0 nu este semnificativ diferit de 0.
ˆ aˆ0 9656,855
Pentru parametrul a1 :
aˆ1 0,2643
t 4,41 2,093 - acceptăm că a1 este semnificativ diferit de 0.
ˆ aˆ1 0,0035984
Pentru parametrul a2 :
aˆ 2 11,065
t 2,77 2,093 - acceptăm că a2 este semnificativ diferit de 0.
ˆ aˆ2 15,9129
Pentru parametrul a3 :
aˆ 3 3,1281
t 2,92 2,093 - acceptăm că a3 este semnificativ diferit de 0.
ˆ aˆ3 1,1486
Pentru parametrul a0 :
Prob(aˆ0 t19
0, 05
ˆ aˆ0 a0 aˆ0 t190,05ˆ aˆ0 ) 0,95
Prob(20,53 2,093 98,2693 a0 20,53 2,093 98,2693) 0,95
Prob( - 185,15 a0 226,21) 0,95
( yˆ t y ) 2 t
2
R2 t 1
T
1 T
t 1
(y
t 1
t y) 2 (y
t 1
t y) 2
Variabila reziduală 23
SPR t2 47387,5 19
t 1
23
SPT ( yt y ) 2 140311,2
Total 22
t 1
t
2
47387,05
R2 1 T
t 1
1 0,6623
(y
140311,2
t 339,35) 2
t 1
Aceleaşi rezultate cu privire la model, obţinute prin software-ul Eviews sunt următoarele: