Probleme Rezolvate Regresie Si Corelatie
Probleme Rezolvate Regresie Si Corelatie
Probleme Rezolvate Regresie Si Corelatie
REGRESIA LINIARA
1. Pentru un magazin de mobil s-au cules date privind numrul de spoturi publicitare difuzate i
numrul vizitatorilor (mii pers.) timp de 14 zile. Datele sunt prezentate n tabelul 4.1.
Tabelul 4.1
Ziua Nr. spoturi publicitare Nr.vizitatori(mii pers.)
0 1 2
1 7 42
2 5 32
3 1 10
4 8 40
5 10 61
6 2 8
7 6 35
8 7 34
9 9 45
10 3 11
11 12 64
12 8 37
13 4 30
14 11 55
Rezolvare:
a) Notm cu X variabila factorial, independent nr.spoturi publicitare i cu Y variabila
dependent nr.vizitatori.
Pentru a identifica existena, forma i sensul legturii dintre variabilele analizate construim
corelograma (figura 4.1).
70
60
50
nr.vizitatori
40
30
20
10
0
0 2 4 6 8 10 12 14
nr.spoturi
r
n xi yi xi yi
b
n x 2
i
xi
2
2
n yi yi
2
n yi
2
yi
2
10318 10318
0 ,9615
2033 14 22190 504 2 10731
Acest indicator ne arat o legtur direct i foarte puternic (r este pozitiv i apropiat de valoarea
unitar).
2. Un analist de marketing urmrete n 5 luni efectul reclamelor asupra veniturilor din vnzri. El
nregistreaz cheltuielile cu reclama (X) (mii RON) i veniturile din vnzri, Y (sute mii RON). n
urma prelucrrii rezultatelor, obine:
xi 15 ; yi 10 ; xi2 55 ; xi yi 37 . n ipoteza unei dependene liniare, s se
determine ecuaia de regresie.
Rezolvare:
nb0 b1 xi y i
b0 xi b1 xi xi y i
2
3. Pentru opt judee ale Romniei, se cunosc: suprafaa cultivat n 1996 ( mii ha) i producia
agricol total n acelai an (mil. RON preuri curente):
Tabelul 4.14
Judeul Suprafaa cultivat n Producia agricol
1996 (mii ha) (mil. RON)
Alba 127 75,1
Arad 342 112,4
Bistria Nsud 98 64,4
Botoani 286 89,4
Braov 111 80,4
Buzu 252 84,3
Cara Severin 124 62
Clrai 404 96,5
S se studieze existena, direcia i intensitatea legturii dintre suprafaa cultivat i producia
agricol, cu ajutorul coeficienilor de corelaie a rangurilor ai lui Spearman i Kendall.
Rezolvare:
Coeficientul lui Spearman se determin cu relaia:
6 di2
rs 1
n n2 1
,
unde di reprezint diferena ntre rangurile celor dou variabile, aferente aceleiai uniti. Se
ordoneaz perechile de valori n ordinea cresctoare a valorilor xi, apoi se atribuie ranguri valorilor celor
dou variabile (tabelul 4.15.).
Tabelul 4.15
Jude Suprafaa Producia
(xi) (yi)
Rx Ry di d i2
Bistria Nsud 127 75,1 1 2 -1 1
Braov 342 112,4 2 4 -2 4
Cara Severin 98 64,4 3 1 2 4
Alba 286 89,4 4 3 1 1
Buzu 111 80,4 5 5 0 0
Botoani 252 84,3 6 6 0 0
Arad 124 62 7 8 -1 1
Clrai 404 96,5 8 7 1 1
Total 12
6 12
rs 1 0 ,86 , valoare ce indic o legtur direct, puternic, ntre cele dou variabile.
8 63
Coeficientul lui Kendall se calculeaz cu relaia:
2 pi qi
rk
n(n 1)
, unde pi reprezint suma rangurilor superioare (pi) i qi este suma
Tabelul 4.16
Jude Rx Ry pi qi
Bistria Nsud 1 2 6 1
Braov 2 4 4 2
Cara Severin 3 1 5 0
Alba 4 3 4 0
Buzu 5 5 3 0
Botoani 6 6 2 0
Arad 7 8 0 1
Clrai 8 7 0 0
Total - - 24 4
4. Datele sistematizate, obinute n urma unui studiu statistic privind vechimea n munc i timpul
zilnic nelucrat, efectuat pe 800 de salariai ai unei societi comerciale, sunt:
Tabelul 4.17
Timp nelucrat (u.m.)
Vechimea
sub 60 u.m. peste 60 u.m.
peste 10 ani 300 150
sub 10 ani 100 250
S se precizeze dac ntre cele dou variabile exist o legtur.
Rezolvare:
Se folosete coeficientul de asociere Yulle, calculat cu relaia:
n11 n22 n12 n21
QY , unde n11 = 300, n22 = 250, n21 = 100, n12 = 150.
n11 n22 n12 n21
300 250 100 150 60.000
QY 0,67 .
300 250 100 150 90.000
Rezult c ntre cele dou variabile exist o asociere pozitiva de intensitate medie.