Cursuri Bazele Statisticii

Descărcați ca pdf sau txt
Descărcați ca pdf sau txt
Sunteți pe pagina 1din 78

4.

Probabilități și distribuții teoretice

Experiență aleatoare. Eveniment aleator


 Experiență aleatoare = este experiența al cărei rezultat variază la întâmplare
 Aruncarea unei monede;
 Arucarea unui zar;
 Extragerea unei bile din urnă.
-Se cunosc rezultatele posibile ale unei experiențe, dar nu știm, pentru o anumită experiență care
va fi rezultatul obținut.

 Evenimenul aleatoare = este rezultatul unei experiențe aleatoare.


 Spațiul de selecție = este mulțimea tuturor rezultatelor posibile ale unui experiment.

4.1. Probabilități
 a. Definiția clasică a probabilității (Bernoulli și Laplace) - Probabilitatea ca un eveniment
să se realizeze reprezintă raportul dintre numărul de evenimente elementare favorabile şi
numărul evenimentelor egal posibile.
m
p
n
 m este numărul cazurilor favorabile şi
 n este numărul cazurilor posibile
 unde 0 ≤ m ≤ n, ceea ce implică 0 ≤ p ≤ 1.
 Valoarea p=0 corespunde evenimentului imposibil, iar valoarea p=1 corespunde
evenimentului cert sau sigur.
NB: Aceasta probabilitate mai poarta denumirea de probabilitate a priori deoarece poate
fi calculata pe baza unui rationament logic cunoscandu-se valoarea ei inaintea producerii
experimentului si are caracter de lege!!!

b. Definiţia probabilităţii bazată pe frecvenţă


 Probabilitatea este definită ca un caz limită al frecvenţei, atunci când numărul de
experienţe tinde la infinit, adică este frecvenţa relativă de apariţie a unui eveniment.
m
p  lim
n  n

4.2 Variabile aleatoare


4.2.1. Definire
 Variabila aleatoare X este o funcţie care asociază fiecărui eveniment elementar un număr
real (o probabilitate).
 v.a. se notează cu X
 valorile unei v.a. X se notează cu xi
 Probabilitatea ca variabila aleatoare X să ia o anumită valoare este p.

x 
Variabila aleatoare discretă este definită prin: X :  i 
 pi 
Variabilele aleatoare continue sunt definite cu ajutorul unei funcţii f(x), care se numeşte funcţie
densitate de probabilitate.
 Funcţia densitate de probabilitate are următoarele proprietăţi:
() x  R, f ( x)  0


 f ( x)  dx  1


4.2.2. Distribuţia unei variabile aleatoare. Funcţia de repartiţie


 Distribuţia sau legea de probabilitate a unei variabile aleatoare este dată prin funcţia sa
de probabilitate P(X).
 Pe baza funcţiei de probabilitate a unei variabile aleatoare, se determină funcţia sa de
repartiţie. În general, funcţia de repartiţie este definită prin relaţia:
F ( x)  P( X  x), () x  R

 Funcţia de repartiţie are următoarele proprietăţi:

() x  R, 0  F ( x)  1
() a,b  R, a  b, F(a)  F(b)
lim F ( x)  1
x  
lim F ( x)  0
x  
 Pentru variabila discretă, funcţia de repartiţie este F ( x)  p
{ xi  x}
i

x
 Pentru variabila continuă, F ( x)   f (t )  dt , () x  R


4.2.3. Caracteristici numerice ale unei variabile aleatoare


Media şi varianţa unei variabile aleatoare sunt:
  M (X )

 Media unei v.a. X se numeşte şi speranţa matematică a variabilei X şi se notează şi


cu E(X).

   xi f ( xi )
Media unei v.a. discrete X este: i


   xf ( x )dx
Media unei v.a. continue X este: 

Varianţa unei v.a.


Varianţa unei v.a. se notează cu σ2 sau D2(X).

 2  V (X )
Varianţa unei v.a. discrete X:

 2   ( xi   )2 f ( xi )
i

Varianţa unei v.a. continue X:



 2   ( x   )2 f ( x )dx


4.3. Distribuţii utilizate în statistică


a) Distribuţia normală (generalizată)
Repartiţia normală generalizată se simbolizează N ( , 2 ) .

Funcţia densitate de probabilitate, în cazul unei repartiţii normale generalizate, este:


( x )2
1 
f ( x)  e 2 2

 2
 Distribuţia normală este modelul de distribuţie cel mai des întâlnit în cazul v.a.
continue.
 Distribuţia normală are rol fundamental în teoria selecţiei, analiza de regresie,
analiza variaţiei şi covariaţiei.

b) Distribuţia normală standard


 Variabila normală standard se obţine dintr-o variabilă normală generalizată prin
procedeul de standardizare:
X 
Z

 O variabilă aleatoare repartizată după o lege normală standard, simbolizată N(0,1), are o
funcţie densitate de probabilitate dată de relaţia:
2
z
1 
f ( z)  e 2
2

1
F( z )   ( z )
Funcţia de repartiţie este: 2

(tabelul de probabilitate pt variabila normala standard, Z-valorile zi si probabilitatile acestora)


Proprietăţile funcţiei lui Laplace, Φ(z), necesare pentru a calcula orice tip de probabilitate, sunt
urmatoarele:
1. Φ(zi)=P(0<Z<zi)
2. Φ(0) = 0
3. Φ(-zi) = - Φ(zi)
4. Dacă z1< z2, atunci P( z1  Z  z2 )  ( z2 )  ( z1 )

   zi 
1
P ( Z  zi ) 
5. 2
1
6. P(Z>zi)=1-P(Z<zi)=   ( zi )
2
 Pe baza funcţiei lui Laplace, se poate determina, de exemplu, probabilitatea ca variabila
aleatoare normală standard să ia valori într-un interval simetric de tipul (- zi; zi). Această
probabilitate este:

P( zi  Z  zi )  ( zi )  ( zi )  2( zi )


c) Distribuţia chi-patrat

- O variabilă aleatoare repartizată după o lege chi-pătrat este simbolizată  2 ( ,  ) .

d) Distribuţia Student
- O variabilă aleatoare repartizată după o lege Student, simbolizată t(υ), unde υ reprezintă
numărul de grade de libertate, parametrul acestei distribuţii.
Exemplu: Pentru o variabilă aleatoare care urmează o lege de repartiţie Student cu v = 17
grade de libertate (X ~ t (17)), să se citească valoarea teoretică t0.05,17 și t0.025,17.

e) Distribuţia Snedecor-Fisher
O variabilă aleatoare repartizată după o lege Snedecor-Fisher, simbolizată , unde υ1 şi
υ2 reprezintă grade de libertate, parametrii repartiţiei Snedecor-Fisher.
Exemplu: Pentru o variabilă X ~ F(30, 5), se cere citească valoarea teoretică F0.05,30,5 ,
F0.01,30,5.
Exercitii:
1. Se arunca un zar de 55 ori obtinandu-se pentru cifra 1=> 7 aparitii, pentru cifra 2 =>18
aparitii, pentru cifra 3 => 9 aparitii, pentru cifra 4 => 4 aparitii, pentru cifra 5 =>12
aparitii, pentru cifra 6 =>5 aparitii.

a. Calculati probabilitate de aparitie pentru fiecare cifra;


b. Construiti tabloul repartiei.

X N 6,16 
2. O variabilă aleatoare . Precizați valoarea mediei, varianței și abaterii
standarad a variabilei aleatoare X.
3. Pentru un esantion de 111 de studenti s-a inregistrat punctajul obtinut la un test astfel:

punctaj 3 4 5 6 7 8 9 10

nr.studenti 9 11 22 15 19 15 13 7

a. Determinati frecventa relativa de aparitie a notelor:


b. Determinati media si abaterea standard pentru variabila aleatoare considerate;

4. La aruncarea unui zar rezultatele posibile sunt de la 1 la 6. Calculaț i


probabilităț ile de apariț ie ale fiecărei feț e și apariț ia unei feț e impare.

5. Pentru o populație, se înregistrează punctajul obținut la un test (X ) și se observă că variabila X ~


N(65, 9). Se cere să se calculeze și să se interpreteze: P (X > 69)

6. Presupunem ca masuratorile de curent intr-o banda de sarma urmeaza o distributie normala cu o


medie μ = 15 (mA-miliamperi) si o varianta egala cu 4 (mA)2. Calculati:

a. P(X>19)
b. P (X< 12)
c. P(11<X<14)
7. O variabilă aleatoare Z N 0,1 . Determinați valoarea lui a dacă P  a  Z  a   0,95 .
8. Știind ca punctajele obținute la un test de catre o serie de studenti X ~ N(55, 36), să se
precizeze cum sunt distribuite punctajele în rândul studenților.
9. Într-o clasă s-au obț inut următoarele note:

5 de către 8 elevi

7 de către 3 elevi

8 de către ? elevi

10 de către 4 elevi.

Funcț ia notă ia valorile 5,7,8,10, iar probabilităț ile corespunzătoare sunt:

8/20, 3/20, ? , 4/20 .

Care este probabilitatea ca un student să ia nota 8? Calculaț i media și dispersia
pentru variabila considerată.

10. Pentru exerciț iul anterior calculaț i : Z~(0,1)- distribuț ia normal standardizată
 
11. Pentru o variabilă X N  , 2 , să se afle P(    X    ) .

X N  4 , 25 
12. O variabilă . Se cere să se calculeze și să se interpreteze:
a. P(4<X<10)
b. P(1<X<4)
c. P(X>4)
d. P(X<4)
e. P(X>7)
f. P(X<2)
g. P(7<X<11)
h. P(0<X<2)
i. P(1<X<6)
j. P(X>1)
k. P(X<13)
Exercitii:
1. Se arunca un zar de 55 ori obtinandu-se pentru cifra 1=> 7 aparitii, pentru cifra 2 =>18
aparitii, pentru cifra 3 => 9 aparitii, pentru cifra 4 => 4 aparitii, pentru cifra 5 =>12 aparitii,
pentru cifra 6 =>5 aparitii.

c. Calculati probabilitate de aparitie pentru fiecare cifra;


p1= 7/55 = 0,12
p2= 18/55 = 0,32
p3= 9/55 = 0,16
p4= 4/55 = 0,07
p5= 12/55 = 0,21
p6= 5/55 = 0,09

d. Construiti tabloul repartiei.

 xi 
X :  
 pi  1 2 3 4 5 6
X: (0.12 0.32 0.16 0.07 0.21 0.09
)

2. O variabilă aleatoare X N 6,16  . Precizați valoarea mediei, varianței și abaterii standarad


a variabilei aleatoare X.

Rezolvare:

O distribuție normală este caracterizată de medie și de varianță X N   , 2 

Media   6

Varianța 2  16

Abaterea standard   4

3. Pentru un esantion de 111 de studenti s-a inregistrat punctajul obtinut la un test astfel:

punctaj 3 4 5 6 7 8 9 10

nr.studenti 9 11 22 15 19 15 13 7

Se cere:
c. Determinati frecventa relativa de aparitie a notelor:

punctaj 3 4 5 6 7 8 9 10

nr.studenti(fi) 0.081 0.099 0.198 0.135 0.171 0.135 0.117 0.06


d. Determinati media si abaterea standard pentru variabila aleatoare considerate;
μ = M(X) = 3*0.081+4*0.099+5*0.198+6*0.135+7*0.171+8*0.135+9*0.117+10*0.06=6.36
σ2 = V(X) = (3-6.36)2*0.081+(4-6.36)2*0.099+(5-6.36)2*0.198+(6-6.36)2*0.135+(7-6.36)2*0.171+(8-
6.36)2*0.135+(9-6.36)2*0.117+(10-6.36)2*0.06 = 3.05

4. La aruncarea unui zar rezultatele posibile sunt de la 1 la 6. Calculaț i


probabilităț ile de apariț ie ale fiecărei feț e și apariț ia unei feț e impare.

𝑃(𝑖𝑚𝑝𝑎𝑟) = 𝑃(1) + 𝑃(3) + 𝑃(5) = 0,5

Interpretare: Probabilitatea ca la aruncarea unui zar faț a să fie impară este de 50%

5. Pentru o populație, se înregistrează punctajul obținut la un test (X ) și se observă că variabila


X ~ N(65, 9). Se cere să se calculeze și să se interpreteze: P (X > 69)

xi   69−65
zi  => zi = = 1.33 Valoarea lui φ(1.33) se ia din tabelul Laplace
 3

Folosind proprietatea Laplace 6:

PZ  zi   0.5   zi 

P (X > 69) = P (Z > 1.33) = 0.5 - φ(1.33)= 0.5 – 0.4082 = 0.0918


Exista 9.18 % (0.0918 * 100) sanse ca o persoană să obțina un punctaj mai mare decât 69.
Sau: cel mai probabil, 9,18 % dintre persoane au un punctaj mai mare de 69.

6. Presupunem ca masuratorile de curent intr-o banda de sarma urmeaza o distributie normala cu


o medie μ = 15 (mA-miliamperi) si o varianta egala cu 4 (mA)2. Calculati:

a. P(X>19)
xi   19−15
aplicam un procedeu de standardizare pentru a obtine Z => zi  zi = =2
 2

Folosind proprietatea Laplace 6: Valoarea lui φ(2) se ia din tabelul Laplace

PZ  zi   0.5   zi 


P (X > 19) = P (Z > 2) = 0.5 - φ(2) = 0.5 – 0.4772 = 0.0228
Exista 2.28 % (0.0228 * 100) sanse sa se obtina o masuratoare mai mare de 19 mA.
Sau: cel mai probabil, 2.28 % dintre masuratori o sa inregistreze o valoare mai mare de 19 mA.
b. P (X< 12)

xi   12−15 −3
zi  zi = = = −1,5
 2 2 Folosind proprieteate 3 obtinem φ(-1.5)= - φ(1.5)

Folosind proprietatea Laplace 5:

   zi 
1
P ( Z  zi ) 
2
P (X < 12) = P (Z < +1.5) = 0.5 + φ(-1.5) = 0.5 + (- φ(1.5)) = 0.5 - φ(1.5) = 0.5 – 0.4332 = 0.0668
Exista 6,68 % (0.0668* 100) sanse sa se obtina o masuratoare mai mica de 12 mA.
Sau: cel mai probabil, 6,68 % dintre masuratori o sa inregistreze o valoare mai mica de 12 mA.

c. P(11<X<14)

xi  
zi 

11−15 −4
z1 = 2
= 2
= −2
14−15 −1
z2 = 2
= 2
= −0.5

Folosind proprietatea Laplace 4:

P(11< X <14) = P ( z1< Z < z2) = P (-2 < Z < -0.5) = φ (z2) - φ (z1) = φ(-0.5) - φ(-2) = -φ(0.5) + φ(2)
= -0.1915 + 0.4772 = 0.2857
Exista 28,57 % (0.2857* 100) sanse sa se obtina o masuratoare curpinsa intre 11 si 14 mA.
Sau: cel mai probabil, 28,57 % dintre masuratori o sa inregistreze o valoare curpinsa intre 11 si 14
mA.

7. O variabilă aleatoare Z N 0,1 . Determinați valoarea lui a dacă P  a  Z  a   0,95 .

Rezolvare

P  a  Z  a   0,95
  a     a     a     a   2    a 

2  a
=0,95

  a   0, 475  a  1, 96

8. Știind ca punctajele obținute la un test de catre o serie de studenti X ~ N(55, 36), să se


precizeze cum sunt distribuite punctajele în rândul studenților.

 68.3% dintre studenți au punctaje între 49 și 61;


Pt o probabilitate de 68.3% ne folosim de P(μ-σ<X< μ+σ) = P(55-6 < X < 55+6)
P = (49 < X < 61)
 95.4% dintre studenți au punctaje între 43 și 67;
 99,7% dintre studenți au punctaje între 37 și 73.

9. Într-o clasă s-au obț inut următoarele note:

5 de către 8 elevi

7 de către 3 elevi

8 de către ? elevi

10 de către 4 elevi.

Funcț ia notă ia valorile 5,7,8,10, iar probabilităț ile corespunzătoare sunt:

8/20, 3/20, ? , 4/20 .

Care este probabilitatea ca un student să ia nota 8? Calculaț i media și


dispersia pentru variabila considerată.
Probabilitatea ca nota 5 să î mi apară î n eșantion este: 8/20 (cazuri favorabile/cazuri
posibile) Probabilitatea ca nota 7 să î mi apară î n eșantion este: 3/20
Probabilitatea ca nota 8 să î mi apară î n eșantion este: 5/20 – Raspuns final
Probabilitatea ca nota 10 să î mi apară î n eșantion este: 4/20

Funcț ie de probabilitate- suma tuturor probabilităț ilor este 1 Eveniment imposibil și
are probabilitatea de apariț ie 0.

Evenimentul cert și este evenimentul ca eu alegând un elev din cei 20, el să aibă una
din cele 4 note posibile.

10. Pentru exerciț iul anterior calculaț i : Z~(0,1)- distribuț ia normal standardizată

11. Pentru o variabilă X  


N  , 2 , să se afle P(    X    ) .
Rezolvare
x1    
z1 
      1

x2    
z2 
    
1

P(    X    )  P  1  Z  1   1    1   1   1  2  0, 3413  0, 6823

X N  4 , 25 
12. O variabilă . Se cere să se calculeze și să se interpreteze:
l. P(4<X<10)
m. P(1<X<4)
n. P(X>4)
o. P(X<4)
p. P(X>7)
q. P(X<2)
r. P(7<X<11)
s. P(0<X<2)
t. P(1<X<6)
u. P(X>1)
v. P(X<13)

Rezolvare:
Pentru că valorile funcției normale standard sunt tabelate vom transforma probabilitățile
cerute din X în Z după relația:

xi  
zi 

X 
N  , 2  Z  N  0,1

a) P(4<X<10)

44
x1  4 z1  0
5
10  4 6
x2  10 z2    1, 2
5 5

 
P(4<X<10)=P(0<Z<1,2)=  1, 2 =0,3849

b) P(1<X<4)

1  4 3
x1  1 z1    0, 6
5 5
44
x2  4 z2  0
5

       
P(1<X<4)= P(-0,6<Z<0)=  0   0, 6   0   0 , 6 =0+0,2257=0,2257

c) P(X>4)

44
x1  4 z1  0
5
1
P(X>4)=P(Z>0)=  (0) =0,5
2
d) P(X<4)

44
x1  4 z1  0
5
1
P(X<4)=P(Z<0)=  (0) =0,5
2
e) P(X>7)
74 3
x1  7 z1    0, 6
5 5
1
P(X>7)=P(Z>0,6)=  (0, 6)  0, 5  0, 2257  0, 2743
2
f) P(X<2)

2  4 2
x1  2 z1    0, 4
5 5
1 1
P(X<2)=P(Z<-0,4)=  (0, 4)   (0, 4) =0,5-0,1554=0,3446
2 2
g) P(7<X<11)

74 3
x1  7 z1    0, 6
5 5
11  4 7
x2  11 z2    1, 4
5 5

   
P(7<X<11)=P(0,6<Z<1,4)=  1, 4   0 , 6  0 , 4192  0 , 2257 =0,1935

h) P(0<X<2)

0  4 4
x1  0 z1    0, 8
5 5
2  4 2
x2  2 z2    0, 4
5 5

   
P(0<X<2)=P(-0,8<Z<-0,4)=  0, 4   0 , 8   0 , 8   0 , 4    
 0, 2881  0,1554  0,1327
i) P(1<X<6)

1  4 3
x1  1 z1    0, 6
5 5
64
x2  6 z2   0,10
5

      
P(1<X<6)=P(-0,6<Z<0,10)=  0,1   0, 6   0,1   0, 6  0, 0398  0, 2257 
=0,2655
j) P(X>1)

1  4 3
x1  1 z1    0, 6
5 5
   0, 6   0, 5    0, 6   0, 5  0, 2257  0, 7257
1
P(X>1)=P(Z>-0,6)=
2

k) P(X<13)

13  4 9
x1  13 z1    1, 8
5 5

  1, 8  0, 5  0, 4713  0, 0287


1
P(X<13)=P(Z>1,8)=
2
Valorile funcţiei Laplace

0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852

0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830

1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015

1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177

1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441

1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545

1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633

1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767

2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817

2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857

2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890

2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936

2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952

2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964

2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974

2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981

2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986

3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
Repartiţia Student

df\p 0.10 0.05 0.025 0.01 0.005

1 3,078 6,314 12,706 31,821 63,657

2 1,886 2,920 4,303 6,965 9,925

3 1,638 2,353 3,182 4,541 5,841

4 1,533 2,132 2,776 3,747 4,604

5 1,476 2,015 2,571 3,365 4,032

6 1,440 1,943 2,447 3,143 3,707

7 1,415 1,895 2,365 2,998 3,499

8 1,397 1,860 2,306 2,896 3,355

9 1,383 1,833 2,262 2,821 3,250

10 1,372 1,812 2,228 2,764 3,169

11 1,363 1,796 2,201 2,718 3,106

12 1,356 1,782 2,179 2,681 3,055

13 1,350 1,771 2,160 2,650 3,012

14 1,345 1,761 2,145 2,624 2,977

15 1,341 1,753 2,131 2,602 2,947

16 1,337 1,746 2,120 2,583 2,921

17 1,333 1,740 2,110 2,567 2,898

18 1,330 1,734 2,101 2,552 2,878

19 1,328 1,729 2,093 2,539 2,861

20 1,325 1,725 2,086 2,528 2,845

21 1,323 1,721 2,080 2,518 2,831

22 1,321 1,717 2,074 2,508 2,819

23 1,319 1,714 2,069 2,500 2,807

24 1,318 1,711 2,064 2,492 2,797


25 1,316 1,708 2,060 2,485 2,787

26 1,315 1,706 2,056 2,479 2,779

27 1,314 1,703 2,052 2,473 2,771

28 1,313 1,701 2,048 2,467 2,763

29 1,311 1,699 2,045 2,462 2,756

30 1,310 1,697 2,042 2,457 2,750

inf 1,282 1,645 1,960 2,326 2,576


Repartiţia Chi-pătrat

df\area .100 .050 .025 .010 .005

1 2,706 3,841 5,024 6,635 7,879

2 4,605 5,991 7,378 9,210 10,597

3 6,251 7,815 9,348 11,345 12,838

4 7,779 9,488 11,143 13,277 14,860

5 9,236 11,071 12,833 15,086 16,750

6 10,645 12,592 14,449 16,812 18,548

7 12,017 14,067 16,013 18,475 20,278

8 13,362 15,507 17,535 20,090 21,955

9 14,684 16,919 19,023 21,666 23,589

10 15,987 18,307 20,483 23,209 25,188

11 17,275 19,675 21,920 24,725 26,757

12 18,549 21,026 23,337 26,217 28,300

13 19,812 22,362 24,736 27,688 29,819

14 21,064 23,685 26,119 29,141 31,319

15 22,307 24,996 27,488 30,578 32,801

16 23,542 26,296 28,845 32,000 34,267

17 24,769 27,587 30,191 33,409 35,718

18 25,989 28,869 31,526 34,805 37,156

19 27,204 30,144 32,852 36,191 38,582

20 28,412 31,410 34,170 37,566 39,997

21 29,615 32,671 35,479 38,932 41,401

22 30,813 33,924 36,781 40,289 42,796

23 32,007 35,172 38,076 41,638 44,181

24 33,196 36,415 39,364 42,980 45,559

25 34,382 37,652 40,646 44,314 46,928


26 35,563 38,885 41,923 45,642 48,290

27 36,741 40,113 43,195 46,963 49,645

28 37,916 41,337 44,461 48,278 50,993

29 39,087 42,557 45,722 49,588 52,336

30 40,256 43,773 46,979 50,892 53,672


Repartiţia Durbin-Watson

 = 0,05 k reprezintă numărul de parametri din model

n k=2 k=3 k=4 k=5 k=6

dL dU dL dU dL dU dL dU dL dU
Repartiţia Fisher
df2/df1 1 2 3 4 5 6 7

1 161,448 199,500 215,707 224,583 230,162 233,986 236,768

2 18,513 19,000 19,164 19,247 19,296 19,330 19,353

3 10,128 9,552 9,277 9,117 9,014 8,941 8,887

4 7,709 6,944 6,591 6,388 6,256 6,163 6,094

5 6,608 5,786 5,410 5,192 5,050 4,950 4,876

6 5,987 5,143 4,757 4,534 4,387 4,284 4,207

7 5,591 4,737 4,347 4,120 3,972 3,866 3,787

8 5,318 4,459 4,066 3,838 3,688 3,581 3,501

9 5,117 4,257 3,863 3,633 3,482 3,374 3,293

10 4,965 4,103 3,708 3,478 3,326 3,217 3,136

11 4,844 3,982 3,587 3,357 3,204 3,095 3,012

12 4,747 3,885 3,490 3,259 3,106 2,996 2,913

13 4,667 3,806 3,411 3,179 3,025 2,915 2,832

14 4,600 3,739 3,344 3,112 2,958 2,848 2,764

15 4,543 3,682 3,287 3,056 2,901 2,791 2,707

16 4,494 3,634 3,239 3,007 2,852 2,741 2,657

17 4,451 3,592 3,197 2,965 2,810 2,699 2,614

18 4,414 3,555 3,160 2,928 2,773 2,661 2,577

19 4,381 3,522 3,127 2,895 2,740 2,628 2,544

20 4,351 3,493 3,098 2,866 2,711 2,599 2,514

21 4,325 3,467 3,073 2,840 2,685 2,573 2,488

22 4,301 3,443 3,049 2,817 2,661 2,549 2,464

23 4,279 3,422 3,028 2,796 2,640 2,528 2,442

24 4,260 3,403 3,009 2,776 2,621 2,508 2,423

25 4,242 3,385 2,991 2,759 2,603 2,490 2,405

26 4,225 3,369 2,975 2,743 2,587 2,474 2,388

27 4,210 3,354 2,960 2,728 2,572 2,459 2,373

28 4,196 3,340 2,947 2,714 2,558 2,445 2,359


29 4,183 3,328 2,934 2,701 2,545 2,432 2,346

30 4,171 3,316 2,922 2,690 2,534 2,421 2,334

40 4,085 3,232 2,839 2,606 2,450 2,336 2,249

60 4,001 3,150 2,758 2,525 2,368 2,254 2,167

120 3,920 3,072 2,680 2,447 2,290 2,175 2,087

Inf 3,842 2,996 2,605 2,372 2,214 2,099 2,010

df2/df1 8 9 10 20 30 120 INF

1 238,883 240,543 241,882 248,013 250,095 253,253 254,314

2 19,371 19,385 19,396 19,446 19,462 19,487 19,496

3 8,845 8,812 8,786 8,660 8,617 8,549 8,526

4 6,041 5,999 5,964 5,803 5,746 5,658 5,628

5 4,818 4,773 4,735 4,558 4,496 4,399 4,365

6 4,147 4,099 4,060 3,874 3,808 3,705 3,669

7 3,726 3,677 3,637 3,445 3,376 3,267 3,230

8 3,438 3,388 3,347 3,150 3,079 2,967 2,928

9 3,230 3,179 3,137 2,937 2,864 2,748 2,707

10 3,072 3,020 2,978 2,774 2,700 2,580 2,538

11 2,948 2,896 2,854 2,646 2,571 2,448 2,405

12 2,849 2,796 2,753 2,544 2,466 2,341 2,296

13 2,767 2,714 2,671 2,459 2,380 2,252 2,206

14 2,699 2,646 2,602 2,388 2,308 2,178 2,131

15 2,641 2,588 2,544 2,328 2,247 2,114 2,066

16 2,591 2,538 2,494 2,276 2,194 2,059 2,010

17 2,548 2,494 2,450 2,230 2,148 2,011 1,960

18 2,510 2,456 2,412 2,191 2,107 1,968 1,917

19 2,477 2,423 2,378 2,156 2,071 1,930 1,878

20 2,447 2,393 2,348 2,124 2,039 1,896 1,843


21 2,421 2,366 2,321 2,096 2,010 1,866 1,812

22 2,397 2,342 2,297 2,071 1,984 1,838 1,783

23 2,375 2,320 2,275 2,048 1,961 1,813 1,757

24 2,355 2,300 2,255 2,027 1,939 1,790 1,733

25 2,337 2,282 2,237 2,008 1,919 1,768 1,711

26 2,321 2,266 2,220 1,990 1,901 1,749 1,691

27 2,305 2,250 2,204 1,974 1,884 1,731 1,672

28 2,291 2,236 2,190 1,959 1,869 1,714 1,654

29 2,278 2,223 2,177 1,945 1,854 1,698 1,638

30 2,266 2,211 2,165 1,932 1,841 1,684 1,622

40 2,180 2,124 2,077 1,839 1,744 1,577 1,509

60 2,097 2,040 1,993 1,748 1,649 1,467 1,389

120 2,016 1,959 1,911 1,659 1,554 1,352 1,254

Inf 1,938 1,880 1,831 1,571 1,459 1,221 1,000


Repartiţia Fisher

Df2/df1 1 2 3 4 5 6 7

1 4052,181 4999,500 5403,352 5624,583 5763,650 5858,986 5928,356

2 98,503 99,000 99,166 99,249 99,299 99,333 99,356

3 34,116 30,817 29,457 28,710 28,237 27,911 27,672

4 21,198 18,000 16,694 15,977 15,522 15,207 14,976

5 16,258 13,274 12,060 11,392 10,967 10,672 10,456

6 13,745 10,925 9,780 9,148 8,746 8,466 8,260

7 12,246 9,547 8,451 7,847 7,460 7,191 6,993

8 11,259 8,649 7,591 7,006 6,632 6,371 6,178

9 10,561 8,022 6,992 6,422 6,057 5,802 5,613

10 10,044 7,559 6,552 5,994 5,636 5,386 5,200

11 9,646 7,206 6,217 5,668 5,316 5,069 4,886

12 9,330 6,927 5,953 5,412 5,064 4,821 4,640

13 9,074 6,701 5,739 5,205 4,862 4,620 4,441

14 8,862 6,515 5,564 5,035 4,695 4,456 4,278

15 8,683 6,359 5,417 4,893 4,556 4,318 4,142

16 8,531 6,226 5,292 4,773 4,437 4,202 4,026

17 8,400 6,112 5,185 4,669 4,336 4,102 3,927

18 8,285 6,013 5,092 4,579 4,248 4,015 3,841

19 8,185 5,926 5,010 4,500 4,171 3,939 3,765

20 8,096 5,849 4,938 4,431 4,103 3,871 3,699

21 8,017 5,780 4,874 4,369 4,042 3,812 3,640

22 7,945 5,719 4,817 4,313 3,988 3,758 3,587

23 7,881 5,664 4,765 4,264 3,939 3,710 3,539


24 7,823 5,614 4,718 4,218 3,895 3,667 3,496

25 7,770 5,568 4,675 4,177 3,855 3,627 3,457

26 7,721 5,526 4,637 4,140 3,818 3,591 3,421

27 7,677 5,488 4,601 4,106 3,785 3,558 3,388

28 7,636 5,453 4,568 4,074 3,754 3,528 3,358

29 7,598 5,420 4,538 4,045 3,725 3,499 3,330

30 7,562 5,390 4,510 4,018 3,699 3,473 3,304

40 7,314 5,179 4,313 3,828 3,514 3,291 3,124

60 7,077 4,977 4,126 3,649 3,339 3,119 2,953

120 6,851 4,787 3,949 3,480 3,174 2,956 2,792

inf 6,635 4,605 3,782 3,319 3,017 2,802 2,639

Df2/df1 8 9 10 20 30 120 INF

1 5981,07 6022,47 6055,84 6208,73 6260,64 6339,39 6365,86


0 3 7 0 9 1 4

2 99,374 99,388 99,399 99,449 99,466 99,491 99,499

3 27,489 27,345 27,229 26,690 26,505 26,221 26,125

4 14,799 14,659 14,546 14,020 13,838 13,558 13,463

5 10,289 10,158 10,051 9,553 9,379 9,112 9,020

6 8,102 7,976 7,874 7,396 7,229 6,969 6,880

7 6,840 6,719 6,620 6,155 5,992 5,737 5,650

8 6,029 5,911 5,814 5,359 5,198 4,946 4,859

9 5,467 5,351 5,257 4,808 4,649 4,398 4,311

10 5,057 4,942 4,849 4,405 4,247 3,996 3,909

11 4,744 4,632 4,539 4,099 3,941 3,690 3,602

12 4,499 4,388 4,296 3,858 3,701 3,449 3,361

13 4,302 4,191 4,100 3,665 3,507 3,255 3,165

14 4,140 4,030 3,939 3,505 3,348 3,094 3,004

15 4,004 3,895 3,805 3,372 3,214 2,959 2,868

16 3,890 3,780 3,691 3,259 3,101 2,845 2,753


17 3,791 3,682 3,593 3,162 3,003 2,746 2,653

18 3,705 3,597 3,508 3,077 2,919 2,660 2,566

19 3,631 3,523 3,434 3,003 2,844 2,584 2,489

20 3,564 3,457 3,368 2,938 2,778 2,517 2,421

21 3,506 3,398 3,310 2,880 2,720 2,457 2,360

22 3,453 3,346 3,258 2,827 2,667 2,403 2,305

23 3,406 3,299 3,211 2,781 2,620 2,354 2,256

24 3,363 3,256 3,168 2,738 2,577 2,310 2,211

25 3,324 3,217 3,129 2,699 2,538 2,270 2,169

26 3,288 3,182 3,094 2,664 2,503 2,233 2,131

27 3,256 3,149 3,062 2,632 2,470 2,198 2,097

28 3,226 3,120 3,032 2,602 2,440 2,167 2,064

29 3,198 3,092 3,005 2,574 2,412 2,138 2,034

30 3,173 3,067 2,979 2,549 2,386 2,111 2,006

40 2,993 2,888 2,801 2,369 2,203 1,917 1,805

60 2,823 2,718 2,632 2,198 2,028 1,726 1,601

120 2,663 2,559 2,472 2,035 1,860 1,533 1,381

inf 2,511 2,407 2,321 1,878 1,696 1,325 1,000


Seminar 8 Distribuții teoretice

Problema 1

O variabilă aleatoare X N 6,16  . Precizați valoarea mediei, varianței și abaterii


standarad a variabilei aleatoare X.
Rezolvare:

O distribuție normală este caracterizată de medie și de varianță X N   , 2 

Media   6

Varianța 2  16
Abaterea standard   4

Problema 2.
Precizați caracteristicile distribuției normale standard.
Rezolvare:
O distribuție normală standard este simetrică, mezocurtică și are media, varianța și modul egale
cu 0.

Problema 3

O variabilă X N  4 , 25  . Se cere să se calculeze și să se interpreteze:

a) P(4<X<10)
b) P(1<X<4)
c) P(X>4)
d) P(X<4)
e) P(X>7)
f) P(X<2)
g) P(7<X<11)
h) P(0<X<2)
i) P(1<X<6)
j) P(X>1)
k) P(X<13)

215
Rezolvare:
Pentru că valorile funcției normale standard sunt tabelate vom transforma
probabilitățile cerute din X în Z după relația:

xi  
zi 

X  
N  , 2  Z N  0,1

a) P(4<X<10)

44
x1  4 z1  0
5
10  4 6
x2  10 z2    1, 2
5 5

P(4<X<10)=P(0<Z<1,2)=  1, 2  =0,3849

b) P(1<X<4)

1  4 3
x1  1 z1    0, 6
5 5
44
x2  4 z2  0
5

P(1<X<4)= P(-0,6<Z<0)=   0     0, 6     0     0 , 6  =0+0,2257=0,2257

c) P(X>4)

44
x1  4 z1  0
5
1
P(X>4)=P(Z>0)=  (0) =0,5
2
d) P(X<4)
44
x1  4 z1  0
5
1
P(X<4)=P(Z<0)=  (0) =0,5
2
e) P(X>7)
74 3
x1  7 z1    0, 6
5 5

216
1
P(X>7)=P(Z>0,6)=  (0, 6)  0, 5  0, 2257  0, 2743
2
f) P(X<2)

2  4 2
x1  2 z1    0, 4
5 5
1 1
P(X<2)=P(Z<-0,4)=  (0, 4)   (0, 4) =0,5-0,1554=0,3446
2 2
g) P(7<X<11)

74 3
x1  7 z1    0, 6
5 5
11  4 7
x2  11 z2    1, 4
5 5

P(7<X<11)=P(0,6<Z<1,4)=  1, 4     0 , 6   0 , 4192  0 , 2257 =0,1935

h) P(0<X<2)

0  4 4
x1  0 z1    0, 8
5 5
2  4 2
x2  2 z2    0, 4
5 5

P(0<X<2)=P(-0,8<Z<-0,4)=   0, 4     0, 8     0 , 8     0 , 4 

 0, 2881  0,1554  0,1327

i) P(1<X<6)
1  4 3
x1  1 z1    0, 6
5 5
64
x2  6 z2   0,10
5

P(1<X<6)=P(-0,6<Z<0,10)=   0,1    0, 6     0,1    0, 6   0, 0398  0, 2257 =0,2655

j) P(X>1)
1  4 3
x1  1 z1    0, 6
5 5

P(X>1)=P(Z>-0,6)=    0, 6   0, 5    0, 6   0, 5  0, 2257  0, 7257


1
2

217
k) P(X<13)

13  4 9
x1  13 z1    1, 8
5 5

  1, 8  0, 5  0, 4713  0, 0287


1
P(X<13)=P(Z>1,8)=
2

Problema 4

Pentru o variabilă X  
N  , 2 , să se afle P(    X    ) .

Rezolvare

x1     z1 
      1

x2     z2 
      1

P(    X    )  P  1  Z  1   1    1   1   1  2  0, 3413  0, 6823

Problema 5

O variabilă aleatoare Z N 0,1 . Determinați valoarea lui a dacă P  a  Z  a   0,95 .

Rezolvare

P  a  Z  a   0,95

  a     a     a     a   2    a 

2    a  =0,95

  a   0, 475  a  1, 96

Problema 6
Pentru o populație se înregistrează punctajul obținut la un test (X) și se observă că
variabila X N  79 , 9  . Să se afle:

a) proporția persoanelor care au obținut un punctaj mai mare decât 82


b) proporția persoanelor care au obținut un punctaj mai mic decât 84
c) proporția persoanelor care au obținut un punctaj mai mic decât 72

218
d) proporția persoanelor care au obținut un punctaj cuprins între 72 și 84 puncte.

219
Estimarea parametrilor unei populații

1. Numărul de eșantioane posibil de extras

i. eșantionare aleatoare repetată (cu revenire) - k=Nn;


ii. eșantionare aleatoare nerepetată (fără revenire) - 𝑘 = 𝐶𝑁𝑛 .
Exemplu: Se cunosc următoarele valori privind salariul (mii lei) pentru o populație formată
din 5 salariați: 2,5,7,8,9. Să se calculeze nr maxim de eșantioane de volum n = 2 care se pot
extrage aleatoriu repetat și nerepetat din această populație.

2. Parametru – Estimator – Estimație

 Parametri

Parametrii modelului econometric, numiţi şi coeficienţi de regresie, sunt mărimi reale, fixe
dar necunoscute care apar în model în diferite expresii alături de variabile (θ).

 Estimaţii

Estimaţiile sunt valori posibile ale estimatorilor calculate la nivelul unui eşantion sau set de
date observate din realitate.

 Estimatori

Estimatorii sunt variabile aleatoare cu distribuţii de probabilitate cunoscute şi cu proprietăţi


specifice în baza cărora se realizează procesul de estimare a parametrilor modelului
econometric.

Variabile aleatoare determinate din totalul esantioanelor de volum n, extrase din populatia de
referinta N.

220
Parametru  estimator  estimație => Un parametru este estimat prin
intermediul unui estimator, cu ajutorul unei estimații.

Proprietăţi ale estimatorilor:


- nedeplasarea – un estimator este nedeplasat dacă media sau speranţa matematică a
acestuia este egală cu parametrul care se doreşte estimat.

M (ˆ)  

- convergenţa – un estimator este convergent dacă varianţa sa tinde spre 0 atunci când
volumul eşantionului tinde spre volumul populaţiei

V (ˆ)  0, când n  N

- eficienţa – estimatorul este eficient dacă are varianţa cea mai mică dintre toţi estimatorii
posibili pentru parametrul 

V (ˆ)  min im

3. Statistici uzuale în inferența statistică

a) Media de selecție : 2
ˆ ~ N (  , )
n

Proprietățile mediei de selecție:

 Nedeplasarea;
 Convergența;
 Eficiența.

1
b) Dispersia de selecție: S’2 = 𝑛−1 ∑(𝑥𝑖− 𝑥̅ )2

221
c) Proporția de selecție: (1   )
ˆ ~ N (  , )
n
Proprietățile distribuției de selecție:
 Nedeplasarea;
 Convergența;
 Eficiența.
Aplicație
Considerăm 5 firme, care desfășoară un anumit tip de activitate de comerț, distribuite după
cifra de afaceri zilnică, exprimată în zeci de milioane: 2, 5, 4, 5, 7.
a) Să se afle câte eșantioane de volum n = 2 pot fi extrase din populația N = 5 firme
(folosind selecția aleatoare repetată)
b) Să se formeze eșantioanele și să se calculeze media lor.
c) să se formeze distribuț ia mediei de selecț ie.
d) să se calculeze media si varianta distribuț iei formate
e) să se precizeze daca media de selecț ie este un estimator nedeplasat si
urmeaza o lege normala

2
ˆ ~ N (  , )
n

222
Estimarea parametrilor unei populații

1. Numărul de eșantioane posibil de extras

iii. eșantionare aleatoare repetată (cu revenire) - k=Nn;


iv. eșantionare aleatoare nerepetată (fără revenire) - 𝑘 = 𝐶𝑁𝑛 .
Exemplu: Se cunosc următoarele valori privind salariul (mii lei) pentru o populație formată din
5 salariați: 2,5,7,8,9. Să se calculeze nr maxim de eșantioane de volum n = 2 care se pot extrage
aleatoriu repetat și nerepetat din această populație.
 Eșantionare aleatoare repetată: k = 52 = 25 eșantioane de 2 salariați
𝑁! 5! 5! 3!∗4∗5 20
 Eșantionare aleatoare nerepetată: k = C52 =𝑛!(𝑁−𝑛)!=2!(5−2)! =2!∗3! = = =10 eșantioane
2!∗3! 2
de 2 salariați.

2. Parametru – Estimator – Estimație

 Parametri

Parametrii modelului econometric, numiţi şi coeficienţi de regresie, sunt mărimi reale, fixe dar
necunoscute care apar în model în diferite expresii alături de variabile (θ).

 Estimaţii

Estimaţiile sunt valori posibile ale estimatorilor calculate la nivelul unui eşantion sau set de
date observate din realitate.

 Estimatori

Estimatorii sunt variabile aleatoare cu distribuţii de probabilitate cunoscute şi cu proprietăţi


specifice în baza cărora se realizează procesul de estimare a parametrilor modelului econometric.

Variabile aleatoare determinate din totalul esantioanelor de volum n, extrase din populatia de
referinta N.

223
Parametru  estimator  estimație => Un parametru este estimat prin
intermediul unui estimator, cu ajutorul unei estimații.

Proprietăţi ale estimatorilor:


- nedeplasarea – un estimator este nedeplasat dacă media sau speranţa matematică a
acestuia este egală cu parametrul care se doreşte estimat.

M (ˆ)  

- convergenţa – un estimator este convergent dacă varianţa sa tinde spre 0 atunci când volumul
eşantionului tinde spre volumul populaţiei

V (ˆ)  0, când n  N

- eficienţa – estimatorul este eficient dacă are varianţa cea mai mică dintre toţi estimatorii posibili
pentru parametrul 

V (ˆ)  min im

224
3. Statistici uzuale în inferența statistică

d) Media de selecție : 2
ˆ ~ N (  , )
n

Proprietățile mediei de selecție:

 Nedeplasarea;
 Convergența;
 Eficiența.

1
e) Dispersia de selecție: S’2 = 𝑛−1 ∑(𝑥𝑖− 𝑥̅ )2

f) Proporția de selecție: (1   )


ˆ ~ N (  , )
n
Proprietățile distribuției de selecție:
 Nedeplasarea;
 Convergența;
 Eficiența.

Aplicație
Considerăm 5 firme, care desfășoară un anumit tip de activitate de comerț, distribuite după cifra
de afaceri zilnică, exprimată în zeci de milioane: 2, 5, 4, 5, 7.
f) Să se afle câte eșantioane de volum n = 2 pot fi extrase din populația N = 5 firme
(folosind selecția aleatoare repetată)
g) Să se formeze eșantioanele și să se calculeze media lor.
h) să se formeze distribuț ia mediei de selecț ie.
i) să se calculeze media si varianta distribuț iei formate
j) să se precizeze daca media de selecț ie este un estimator nedeplasat si
urmeaza o lege normala
2
ˆ ~ N (  , )
n

Rezolvare:
a) În primul rând, extragem toate cele k eșantioane de volum n = 2 și calculam mediile cifrei
de afaceri pentru toate eșantioanele.
Numarul total de esantioane de extras:

225
k=Nn=52= 25 eșantioane
b) Formarea eșantioanelor si media lor
Eșantionul Media eșantionului Eșantionul Media eșantionului
25 3,5 47 5,5
24 3 44 4
25 3,5 52 3,5
27 4,5 54 4,5
22 2 55 5
52 3,5 57 6
54 4,5 55 5
55 5 72 4,5
57 6 75 6
55 5 74 5,5
42 3 75 6
45 4,5 77 7
45 4,5

c)Distributia de selecție a mediei:


Media eșantionului Frecvența Proporția
2 1 0,04
3 2 0,08
3,5 4 0,16
4 1 0,04
4,5 6 0,24
5 4 0,16
5,5 2 0,08
6 4 0,16
7 1 0,04
Total 25 1

c) Media populatiei pentru seria noastra 2,5,4,5,7


µ=(2+5+4+5+7)/5 =4.6
Varianta populatiei pentru seria noastra 2,5,4,5,7
σ2=[(2-4.6)2+(5-4.6)2+(4-4.6)2+(5-4.6)2+(7-4.6)2]/5 = 2.64
Proprietățile estimatorului media de selecție:
Pentru a verifica daca media de selectie este un estimator nedeplasat adica urmeaza legea
normala
2
ˆ ~ N (  , )
n
226
adica daca media de selectie este egala cu media populatiei (𝑀(𝜇̂ ) = 𝜇 ) adica
𝑀(𝜇̂ ) = 4,6
𝑀(𝜇̂ )2*0.04+3*0.08+3.5*0.16+4*0.04+4.5*0.24+5*0.16+5.5*0.08+6*0.16+7*0.04 =4.6
Media de selectie este un estimator nedeplasat
Calculam abaterea standard a estimatorului:
𝜎 √2.64 1.62
𝜎𝜇̂ = = = = 1.15 𝑉(𝜇̂ ) = 𝜎𝜇̂2 = 1.32
√𝑛 √2 1.41

227
Estimarea punctuală și prin interval de încredere

Problema 1. Pentru o populație formată din 5 firme determinați câte eșantioane se pot extrage
aleator repetat și nerepetat de volum egal cu 3.
Rezolvare:
N=5
n=3
- Extragere aleatoare nerepetată

N! 5! 5! 1 2  3  4  5
K  CNn    
( N  n)! n !  5  3 ! 3! 2 ! 3! 1 2 1 2  3

3 4  5
K  10 eșantioane
23
Interpretare: Din populația de 5 firme se pot extrage aleator nerepetat 10 eșantioane de volum
n=3.
- Extragere aleatoare repetată
K=Nn
K=53=125 eșantioane
Interpretare: Din populația de 5 firme se pot extrage aleator repetat 10 eșantioane de volum
n=3.

Problema 2- Distribuția de selecție a mediei


Se cunosc următoarele valori privind salariul (mii lei) pentru o populație formată din 4 salariați:
2, 4, 6, 8.
Se cere:
a) Să se calculeze numărul maxim de eșantioane de volum n=2 care se pot extrage aleator
nerepetat din această populație
b) Să se formeze distribuția de selecție a mediei.
Rezolvare:

N! 4! 4! 1 2  3  4
K  CNn    
( N  n)! n !  4  2  ! 2 ! 2 ! 2 ! 1 2 1  2

3 4
K  6 eșantioane
1 2

228
b)
Eșantioane Eșantion 1 Eșanti Eșanti Eșanti Eșanti Eșanti
on 2 on 3 on 4 on 5 on 6
xi 2 2 2 4 4 6
4 6 8 6 8 8

xj 
x  x i i
3 4 5 5 6 7
n 2
 x  x   2  3   4  3 
2 2 2

s 2
 i 2
s  2
j
n 1 1
2 1

Distribuția de selecție a mediei

xj ni
3 1
4 1
5 2
6 1
7 1
TOTAL 6
(eșantioane)

Problema 3 – estimarea punctuală a mediei, abaterii standard; estimarea prin interval de


încredere a mediei
Pe un eșantion de 6 studenți, care au urmat un program intensiv de introducere a datelor
în baze de date pe calculator, timp de o săptămână, s-au înregistrat următoarele date privind
viteza de lucru a studenților: 1,37; 1,58; 2,25; 0,94; 2,43; 1,63 minute.
6
1 6
 xi  10, 2 și   xi  x   0,30824 .
2
Pentru datele de mai sus s-au obținut:
i 1 n  1 i 1

Se cere:
1. Să se estimeze punctual media, abaterea standard și varianța vitezei de lucru a tuturor
studenților.
2. Să se estimeze prin interval de încredere media vitezei de lucru a studenților considerând
un risc de 5%.

Rezolvare:

1. a)Estimarea punctuală a mediei:


6

10, 2x i
x  1,7 min
i 1

n 6
Interpretare: Viteza medie de lucru a tuturor studenților este de 1,7 minute.
b) Estimarea punctuală a varianței:

229
6

 x  x 
2
i
s 2  i 1
 0,30824
n 1
c) Estimarea punctuală a abaterii standard:
6

 x  x 
2
i
s  i 1
 0 ,30824  0 ,555 min
n 1
Interpretare: Viteza de lucru a tuturor studenților se abate în medie de la nivelul mediu
cu 0,555 minute în ambele sensuri, pozitiv și negativ.
2. Estimarea prin interval de încredere a mediei
 s 
   x  t / 2;n1 
 n
t / 2;n1  t0 ,025;5  2,571
 0,555 
  1,7  2,571 
 6 
 0,555 
  1,7  2,571  1,7  0,5826
 2, 449 
 1,1174; 2,2826
Interpretare: Cu o probabilitate de 0,95 estimăm că viteza medie de lucru a studenților
este acoperită de intervalul 1,1174; 2, 2826 .
SAU
Ne asumăm un risc de 0,05 ca viteza medie de lucru a tuturor studenților să nu fie
acoperită de intervalul 1,1174; 2, 2826

Problema 4 Estimarea punctuală și prin interval de încredere a proporției

Pentru un eșantion format din 100 persoane, extras aleator simplu și repetat, se constată
că numărul persoanelor cu o vârstă de până la 25 ani este de 8. Se cere să se estimeze punctual
și prin interval de încredere proporția acestei categorii de vârstă, la nivelul întregii populații din
care a fost extras eșantionul, considerând un risc de 0,10.

nA  8 persoane
n  100 persoane
  0,10
 ?
Rezolvare:
1. Estimare punctuală a proporției persoanelor cu o vârstă de până la 25 ani
nA
p
n
8
p  0, 08
100
Interpretare: 8% din persoane au vârsta de până la 25 ani
230
2. Estimarea prin interval de încredere a proporției persoanelor cu o vârstă de până la 25 ani

 p 1  p  p 1  p  
   p  t /2,n 1  ; p  t /2, n 1  
 n n 
t /2,n 1  t0,05;99  1, 645
 0, 08 1  0, 08  0, 08 1  0, 08  
  0, 08  1, 645  ;0, 08  1, 645   sau
 100 100 

 0, 08 1  0, 08  
  0, 08  1, 645  
 100 

 0, 0736 
  0, 08  1, 645  
 100 
 0,08  0,0446
 0,0354;0,1246
Interpretare: Cu o probabilitate de 0,90 estimăm că proporția persoanelor din populație
cu vârsta de până la 25 ani aparține intervalului 0,0354;0,1246
SAU
Ne asumăm un risc de 0,10 ca proporția persoanelor din populație cu vârsta de până la
25 ani să nu aparțină intervalului 0,0354;0,1246 .

Problema 5 (de la curs)

Pentru o probabilitate de 0,95 și o eroarea maxim admisibilă de  3%, să se calculeze


volumul eșantionului.
Ce se întâmplă dacă se utilizează o eroare maxim admisibilă de  2%?
z2  2
n   / 22 

Parametrul  2 , care exprimă gradul de omogenitate al populației, nu se cunoaște, însă
se poate utiliza valoarea lui maximă, care este egală cu 0,25.

1. Eroare maxim admisibilă de  3%.

z2 / 2   2
n
2
2  z   0,95    z   0, 475  din tabel z  1,96
z /2  1,96
1,962  0, 25 3,8416  0, 25 0,9604
n    1067,11  1067
0,032 0,0009 0,0009

231
2. Eroare maxim admisibilă de  2%.

1,962  0, 25 3,8416  0, 25 0,9604


n    2401
0,022 0,0004 0,0004
Concluzii: Pentru a crește precizia estimării, eșantionul ce trebuie extras are un volum mai
mare.

Problema 6.
Pentru un eșantion de 64 angajați ai unei firme s-a estimat salariul mediu ca fiind de 2,6
mii lei. Dintr-o cercetare anterioară se cunoaște că abaterea standard a salariului este de 1,2 mii
lei. Estimați prin interval de încredere salariul mediu al angajaților acestei firmei garantând
rezultatele cu o probabilitate de 0,975.

x  2, 6 mii lei
  1,2 mii lei
2  z   0,975
 ?
Rezolvare:
2  z   0,975    z   0, 4875  z  2, 24
    1, 2 
   x  z / 2     2,6  2, 24    2,6  0,336   2,264; 2,936
 n  64 

Interpretare: Cu o probabilitate de 0,975 estimăm că salariul mediu al angajaților


acestei firme este acoperit de intervalul  2, 264; 2,936 .

Problema 7
Din cele 42 județe ale României selectați aleator un eșantion de 10 județe pentru care s-
a înregistrat rata divorțurilor. Valorile sunt prezentate în tabelul de mai jos:

Pe baza eșantionul extras s-au obținut următoarele rezultate:

232
Se cere:
1. Să se estimeze punctual pentru rata divorțurilor: media, abaterea standard și varianța.
2. Să se estimeze prin interval de încredere rata medie a divorțurilor în județele
României considerând un risc de 5%.
3. Să se estimeze punctual și prin interval de încredere ponderea județelor care au rata
divorțurilor mai mare de 1,37%, garantând rezultatele cu o probabilitate de 90%.

x
s 
s 2 

233
1. Estimarea parametrilor unei populații

a) Punctual: 𝑿 ̅ , S’, p
- punctuală: presuspune aflarea unei valori posibile a estimatorului;
Ex: Se cunosc următoarele rezultate privind vârsta înregistrată pentru un eșantion format din 10
persoane:
19, 20, 19, 22, 24, 26, 20, 28, 19, 20
Să se estimeze punctual proporția persoanelor care au o vârstă de până la 25 ani la nivelul
întregii populații din care a fost extras acest eșantion
𝑚
p= 𝑛

m=8
n = 10
8
p = 10 *100 = 80%

p= 8/10=0,8
b) Prin interval de încredere (IC)
Estimarea prin interval de încredere a mediei unei populații (𝝁):

Estimarea prin interval de î ncredere (IC): presupune calculul limitelor (Li – Lower Bound
și Ls – Upper Bound) î n care se găsește un parametru cu o anumită probabilitate.

 când se cunoaşte parametrul σ :

2
ˆ ~ N (  , )  Z ~ N (0,1)
n
ˆ  
z
/ n
 
P( ˆ  z / 2    ˆ  z / 2 )  (1 )
n n

- la nivelul unui eşantion extras:


   
 x  z / 2 , x  z / 2 
 n n

1−𝛼
- 𝑧𝛼/2 este acel z pt care φ(z) =
2

234
Ex: La nivelul unui eșantion format din 100 de persoane se înregistrează salariul lunar obținut și
se obține ̅
X= 1500 lei, σ = 300 lei. Se cere să se estimeze prin IC salariul mediu al întregii
populații din care a fost extras eșantionul considerând un risc de 5%.
1−0.05
𝛼 = 0,05 => = 0.475 = > z=1.96
2
300 300
IC: [ 1500-1.96 * ; 1500+1.96 * ]
√100 √100

IC: [1441,2; 1558,8]


Interpretare: Cu o probabilitate de 95% estimăm că venitul mediu al întregii populații din care
a fost extras eșantionul este cuprins în intervalul [1441,2;1558,8] lei.

 când nu se cunoaşte parametrul σ :


- Variabila Z devine o variabilă student:
ˆ  
t ~ t( n  1 )
ˆ '
n
 s' s' 
 x  t / 2 , x  t / 2 
 n n

unde:
𝑠′
𝑡𝛼/2 ∗ este eroarea maximă admisibilă sau eroarea limită (Confidence Level);
√𝑛

𝑠′
este eroarea medie de selecț ie sau de reprezentativitate (Standard Error sau Standard
√𝑛
Error of Mean);

s’ este abaterea standard corectată (modificată) (Standard Deviation);

n este volumul eșantionului (Count).

t
- valoarea  / 2 se citeşte din tabelul Student pentru: P( t  t / 2 )   / 2

Ex2: La nivelul unui eșantion de 25 de persoane extras aleator simplu s-au obținut următoarele
rezultate privind vârsta: ̅
X= 35 ani, S’ = 2 ani.
Să se estimeze prin interval de încredere vârsta medie a întregii populații din care a fost extras
eșantionul, considerând un risc de 5%.

235
 s' s' 
 x  t /2 , x  t /2 
 n n
𝛼 = 0,05, 𝑡𝛼/2,𝑛−1 = t0,025, 24 = 2.064
2 2
IC: [ 35-2.064 * ; 35+2.064 * ]
√25 √25

IC: [34.174; 35.825]


Interpretare: Cu o probabilitate de 95% estimăm că vârsta medie a întregii populații din care a
fost extras eșantionul este cuprinsă în intervalul 34,174~34 ani și 35.825 ~ 36 ani.

Estimarea prin interval de încredere a proporției unei populații:


- când se cunoaşte varianţa variabilei alternative:

   
ˆ  z /2 , 
ˆ  z /2 
 n n
- când nu se cunoaşte varianţa variabilei alternative:

 p(1  p ) p (1  p ) 
p t  /2
, pt  /2
n 
 n

p=75% [0;100] p=0,75 [0;1]


Ex3: Într-un sondaj aleatoriu pe un eșantion de 1500 de persoane se observă că 840 de persoane
au votat pentru candidatul A. Să se estimeze prin IC proporția persoanelor care votează pentru
acest candidat, considerând un risc de 5%.
840
p = 1500 =0,56 *100= 56%

𝛼 = 0,05, 𝑡𝛼/2,𝑛−1 = t0,025, 1499 = 1,960

 p(1  p ) p (1  p ) 
p t  /2
, pt  /2
n 
 n
√0.56(1−0.56) √0.56(1−0.56)
IC: [ 0.56 – 1.96 * ; 0.56 +1.96 * ]
√1500 √1500

IC: [0,54;0,58]

Sau

236
√56(100−56) √56(100−56)
IC: [ 56 – 1.96 * ; 0.56 +1.96 * ]
√1500 √1500

IC: [54;58]
Interpretare: Cu o probabilitate de 95% se poate garanta că proporția persoanelor care votează
pentru candidatul A la nivelul întregii populații este cuprinsă între 54% și 58%.

4. Estimarea volumului eșantionului (n)


  z / 2
Eroarea maxim admisibilă: n
z2 / 2   2
n
2

unde:

este eroarea maximă admisibilă (marja de eroare).

este abaterea standard a variabilei alternative pentru care se estimează

Parametru , care exprimă gradul de omogenitate al populaţiei, de regulă nu se cunoaşte,


i ̂nsă i ̂n calculul volumului eşantionului se poate utiliza valoarea lui maximă , care este egală cu
0,25

237
Exercitii:

1.Pentru un eșantion format din 25 de persoane, se cunosc următoarele rezultate privind


veniturile anuale: 𝑥̅=65 mii lei, s’2=121. Să se estimeze prin IC veniturile medii anuale la
nivelul populaț iei din care a fost extras eșantionul, considerând o probabilitate de garantare a
rezultatelor de 95%.

2. Pentru un eșantion format din 100 de persoane, se cunosc următoarele rezultate


privind punctajele obț inute la un test: 𝑥̅= 75 puncte, s’= 10 puncte. Să se estimeze
prin IC punctajele medii obț inute de ansamblul populaț iei din care a fost extras
eșantionul, considerând:

a) o probabilitate de 95%.
b) o probabilitate de 99%.

3. În urma prelucrării datelor privind valoarea vânzărilor anuale (mil. lei) î nregistrate
pentru un eșantion de firme, s-au obț inut următoarele rezultate:

Să se calculeze și să se interpreteze IC pentru media populaț iei, considerând un risc de 5%.

4. În urma prelucrării datelor privind vârsta (ani) î nregistrate pentru un eșantion de
persoane, s- au obț inut următoarele rezultate:

238
Se cere:
a) să se precizeze valoarea erorii limită (erorii maxime admisibile).

b) să se precizeze valoarea erorii medii de reprezentativitate.


c) să se calculeze și să se interpreteze IC pentru media populaț iei.

5. În urma prelucrării datelor privind nota obț inută la un examen de către o serie de
studenț i, s- au obț inut următoarele rezultate:

Se cere
a) să se precizeze eroarea maxim admisibilă;
b) să se interpreteze IC pentru media populaț iei.

6. Pentru un eșantion format din 10000 persoane, se observă că 75% sunt de acord
cu mărirea pedepselor pentru anumite infracț iuni. Să se estimeze prin IC proporț ia
persoanelor care consideră că este necesară mărirea pedepselor pentru anumite
infracț iuni la nivelul populaț iei din care a fost extras eșantionul (α=0,10).

7. Pentru o probabilitate de 0,95 şi o eroare maxim admisibilă de ±3% , să se


calculeze volumul eşantionului care estimează parametrul proporț ie.

8. Într-un studiu clinic, 10 pacienț i au primit un nou medicament cu scopul de a crește


durata somnului. Tabelul adăugat prezintă numărul de ore de somn ce a crescut î n
urma administrării noului medicament. Media eșantionului este 1.58 ore. Presupunem
că populaț ia din care a fost extras eșantionul urmează o lege de distribuț ie normală,
cu varianț a 𝜎2 = 1.664 → 𝜎 = √1.664 = 1.28, estimaț i prin interval de î ncredere media
populaț iei pentru o î ncredere de 99% și 95% sau pentru un risc de 1% și apoi 5%.

239
240
Disciplina ”Bazele statisticii”

Seminar 12
Testarea statistică

I. Testarea statistică
1. Ipoteze statistice:
- ipoteza nulă (H0)
- ipoteza alternativă (H1)

2. Tipuri de teste:

- test bilateral

H0: 𝜃 = 𝜃0
H1: 𝜃 ≠ 𝜃0
Se verifca egalitatea unui
prametru fata de o valoare
fixa.

Observație: Valoarea teoretică se alege din tabel pentru un risc α/2

- test unilateral la dreapta

H0: 𝜃 = 𝜃0
H1: 𝜃 > 𝜃0
Se verifca daca un prametru
este mai mare decat o
valoare fixa.
Observație: Valoarea teoretică se alege din tabel pentru un risc α

- test unilateral la stânga

H0: 𝜃 = 𝜃0
H1: 𝜃 < 𝜃0
Se verifca daca un prametru
este mai mic decat o
valoare fixa.

Observație: Valoarea teoretică se alege din tabel pentru un risc α

241
3) Regula de decizie:

- O valoare calculată a statisticii test (luată în modul) mai mare decât valoarea teoretică duce
la respingerea ipotezei H0 cu o probabilitate α.

II. Testarea ipotezelor privind media unei populații (𝝁)


a) Ipoteze statistice
- ipoteza nulă: 𝐻0 : 𝜇 = 𝜇0 (nu există diferențe semnificative între cele 2 medii)
-ipoteza alternativă: 𝐻1 : 𝜇 ≠ 𝜇0 (există diferențe semnificative între cele 2 medii)

b) Alegerea testului statistic


- pentru testarea mediei unei populații, se alege testul Z (când se cunoaște σ2) sau t Student (când
nu se cunoaște σ2).

c) Alegerea pragului de semnificație 𝛼


-riscul (pragul de semnificaţ ie) α reprezintă probabilitatea de a respinge ipoteza nulă, atunci când
aceasta este adevărată.

- de regulă, se alege 𝛼=0,05

Pentru test bilateral:


t teoretic = 𝑡𝛼; 𝑛−1
2
1−∝
z teoretic = zα = 2
(valoare obtinuta o cautam in tabelul functiei Laplace si aflam valoarea z
teoretic)
Pentru test unilateral:
t teoretic = 𝑡𝛼; 𝑛−1
z teoretic are doua valori prestabilite pentru:
∝= 0,05 => z teoretic= 1,65
∝= 0,01 => z teoretic= 2,33

d) Calculul valorii statisticii test:


𝑥̅ −𝜇0 𝑥̅ −𝜇0
𝑧𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 = , respectiv 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 =
𝜎/√𝑛 𝑠 ′ /√𝑛

e) Regula de decizie:

Dacă se cunoaște σ2:


- dacă |zcalculat|> zα/2, se respinge ipoteza H0 cu o probabilitate de α
- dacă |zcalculat|≤zα/2, nu se respinge ipoteza H0 cu o probabilitate de
(1-α).
- test bilateral Dacă nu se cunoaște σ2:
- dacă |𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 | > 𝑡𝛼;𝑛−1 𝑠𝑎𝑢 |𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 | > 𝑡𝑡𝑒𝑜𝑟𝑒𝑡𝑖𝑐 , se respinge
2
ipoteza H0 cu o probabilitate de α

242
- dacă |𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 | ≤ 𝑡𝛼;𝑛−1 , nu se respinge ipoteza H0 cu o
2
probabilitate de (1-α).

- test unilateral la dreapta Dacă se cunoaște σ2:


sau la stânga - dacă |zcalculat|> zα, se respinge ipoteza H0 cu o probabilitate de α
- dacă |zcalculat|≤zα, nu se respinge ipoteza H0 cu o probabilitate de
(1-α).
Dacă nu se cunoaște σ2:
- dacă |𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 | > 𝑡𝛼; 𝑛−1 , se respinge ipoteza H0 cu o
probabilitate de α
- dacă |𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 | ≤ 𝑡𝛼; 𝑛−1 , nu se respinge ipoteza H0 cu o
probabilitate de (1-α).

III. Testarea ipotezelor privind proporția unei populații (𝝅)


a) Ipoteze statistice
- ipoteza nulă: 𝐻0 : 𝝅 = 𝝅0 (nu există diferențe semnificative între cele 2 proporții)
- ipoteza alternativă: 𝐻1 : 𝝅 ≠ 𝝅0 (există diferențe semnificative între cele 2 proporții)

b) Alegerea testului statistic


- pentru testarea mediei unei populații, se alege testul Z (când se cunoaște σ2) sau t Student (când
nu se cunoaște σ2).

c) Alegerea pragului de semnificație 𝛼


-riscul (pragul de semnificaţ ie) α reprezintă probabilitatea de a respinge ipoteza nulă, atunci când
aceasta este adevărată.

- de regulă, se alege 𝛼=0,05

d) Calculul valorii statisticii test:


𝑝 − 𝝅0
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 =
√𝑝(1 − 𝑝)/√𝑛

e) Regula de decizie:
- este similară cu regula definită la testarea mediei unei populații.

IV. Exemple
Test medie bilateral
1. Pentru un eșantion format din 25 persoane se înregistrează salariul lunar obținut și se obțin
următoarele rezultate: 𝑥̅=1500 (lei) și s’ = 200 (lei). Se cere să se testeze dacă există diferențe

243
semnificative între salariul mediu al întregii populații din care a fost extras eșantionul și
salariul mediu pe economie, de 1300(lei). Se consideră un risc de 0.01
2.La nivelul unui eșantion n=100 persoane se înregistrează salariul lunar și se obține: 𝑥̅=1400
(lei) și σ = 400 (lei). Se cere să se testeze dacă există diferențe semnificative între salariul
mediu al întregii populații din care a fost extras eșantionul și salariul mediu pe economie de
1450(lei). Se consideră un risc de 0.05.

Test medie unilateral (dreapta)


3. Un producător de detergenţi industriali preambalează produsul la cutii ce trebuie să aibă, în
medie, 12 kg. El doreşte să verifice corectitudinea ambalării şi hotărăşte să organizeze un
sondaj de n=100 observaţii (cutii), pentru care obţine greutatea medie 𝑥̅=11.55kg, cu o abatere
standard egală cu s’=0,5kg. Să se testeze ipoteza conform căreia în medie cutiile au câte 12 kg,
cu alternativa că greutatea este mai mare de 12 kg. (>12 kg), pentru o probabilitate de 95%.
Testare proportie
4. Pentru un eșantion format din 23 persoane se observă că procentul de promovare la un
examen este de 70%. Să se testeze dacă există diferențe semnificative între proporția
persoanelor care au promovat examenul la nivelul populației și proporția înregistrată în anul
anteriorm de 73%.(α=0,05)
Testare medie cu tabel SPSS
5. Extragem din totalul județelor un eșantion aleator de 20 de județe, obținând următoarele
rezultate privind emigrarea definitivă: 𝑥̅=337,35 persoane, cu o abatere standard egală cu
s’=179,179. Dorim să aflăm dacă există diferențe semnificative între nr. mediu al emigraților
definitivi în anul 2013 pentru județele României și nr. mediu al emigranților pt anul
precedent,anul 2012. Conform datelor de pe INSSE referitoare la migrația definitivă pentru
anul 2012,observăm in tabelul de mai jos ca media migrației definitive pentru anul 2012 este
egală cu 428 persoane.Prin urmare, vom compara această valoare cu media migrației definitive
pentru anul analizat la nivelul eșantionului, respectiv valoarea 337,35.

244
Exercitii:
1) Pentru un eșantion format din 25 de persoane, se înregistrează salariul lunar obţinut şi se obţin
următoarele rezultate: 𝑥̅ = 15 sute lei și s’= 2 sute lei. Se cere să se testeze dacă există diferenţe
semnificative între salariul mediu al întregii populaţii din care a fost extras eşantionul (𝜇) şi
salariul mediu pe economie, de 13 sute lei. Se consideră un risc de 0,05.

2) Pentru un eșantion format din 100 de persoane, se obțin următoarele rezultate privind nota
obținută la un test: media este 7 și varianța corectată (modificată) este 4. Să se testeze dacă există
diferențe semnificative între nota medie obținută de ansamblul studenților din care a fost extras
eșantionul și nota medie obținută în anul anterior, de 8. Riscul asumat este de 0,10.

3) În urma prelucrării datelor privind valoarea vânzărilor anuale (mil. lei) înregistrate pentru un
eșantion de firme, s-au obținut următoarele rezultate:

Column1
Mean 12.15
Median 12
Mode 10
Standard Deviation 1.8994
Sample Variance 3.6079
Kurtosis -1.31
Skewness 0.4274
Count 20

Să se testeze dacă există diferențe semnificative între valoarea vânzărilor anuale pentru
ansamblul firmelor din care a fost extras eșantionul și vânzările medii înregistrate în anul
anterior, de 14 mil. lei, considerând un risc de 5%.

245
4) O firmă dorește să introducă un nou procedeu de fabricație. Pentru vechiul procedeu, se cunosc
durata medie de viață a produselor de 1200 ore și abaterea standard de 300 de ore. Pentru a testa
noul procedeu, se extrage un eșantion format din 100 de produse și se obține o durată medie de
viață de 1265 de ore. Pentru un risc de 0,05. Să se testeze dacă noul procedeu de fabricație este
mai bun.

5) La nivelul unui eşantion de volum n=25 de persoane, se observă că ponderea persoanelor care
votează pentru candidatul A este de 49%. Se cere să se testeze dacă există diferenţe semnificative
între proporţia persoanelor care votează pentru candidatul A la nivelul întregii populaţii şi
proporţia persoanelor care au votat pentru acest candidat la alegerile anterioare, de 51%. Se
consideră un risc de 5%.

246
Testarea ipotezelor privind doua esantioane (cazul esantioanelor independete)

În cazul eşantioanelor independente, statistica test folosită în testarea ipotezelor statistice este
statistica Z sau t.

Ipoteze statistice:

H0: μ1 -μ2 = 0 (Nu exista diferente intre mediile celor doua grupe)

H1:μ1 -μ2 ≠ 0 (Exista diferente intre mediile celor doua grupe)

Alegerea pragului de semnificaţie şi citirea din tabel a valorii critice a statisticii test

t teoretic = 𝑡𝛼; 𝑛1+𝑛2−2


2

Atunci când σ1 ≠ σ2 statistica test este:

Atunci când σ1 = σ2 statistica test este:

Testarea egalită ti̧ i a trei sau mai multe medii (ANOVA)

Se bazează pe descompunerea variaţiei totale pe componente:

- variaţia explicată (variaţia sub influenţa factorului de grupare)

- variaţia reziduală (variaţia sub influenţa factorilor întâmplători )

VT=VE+VR

247
TSS = ESS + RSS
VT sau TSS -> Varianta totala (Tabel SPSS: Total)

VE sau ESS -> Varianta intergrupe - variaţ ia variabilei X explicată de factorul de grupare
(Tabel SPSS: Between Groups)

VR sau RSS -> Varianta intragrupe- variaţ ia reziduală (Tabel SPSS: Within Groups)

Ipoteze:

H0 : μ1 =μ2 =...=μk
H1 : mediile a cel putin doua populatii sunt diferite

Se alege pragul de semnificaţie α şi se citeşte valoarea critică a testul F din tabelul repartiţiei Fisher,
pentru riscul α admis, şi υ1=k-1 și υ2=n-k grade de libertate

Calculul statisticii test:

Regula de decizie:

Fcalculat > Fteoretic – se respinge ipoteza H0 cu o probabilitate de α

Fcalculat ≤ Fteoretic – nu se respinge ipoteza H0 cu o probabilitate de (1-α).

sau

248
sig (p-value) < 𝛼 - se respinge ipoteza H0 cu o probabilitate de α
sig ≥ 𝛼 - nu se respinge ipoteza H0 cu o probabilitate de (1-α).

249
1. Producția internă de aluminiu în perioada 1992-2000 este prezentată în tabelul 1.1.

Producția de
aluminiu
Anul
( mii tone) (yt)
nivelul absolut
1992 120
1993 116
1994 122
1995 144
1996 145
1997 164
1998 175
1999 176
2000 178
total 1340
(Volumul absolut)

Anul Consumul (l)


(yt)
1992 163,7
1993 176,9
1994 179,5
1995 188,6
2. Consumul anual de lapte (l) din România a cunoscut în
1996 192,7
perioada 1992-1998 următoarea evoluție:
1997 192,4
1998 194,4
1288.2

250
Indicatori ai seriilor de timp
- serie de timp este o serie care prezintă valorile înregistrate de un fenomen Y în diferite momente
de timp, t=1,n.
- Indicatorii care măsoară dinamica unui fenomen pot fi calculaţi:

 în mărime absolută şi se numesc indicatori absoluţi;


 în mărime relativă şi se numesc rate/indici;
 ca mărimi medii şi se numesc indicatori medii.

3. Producția internă de aluminiu în perioada 1992-2000 este prezentată în tabelul 1.1.

Producția de aluminiu Sporul absolut Sporul absolut


Anul ( mii tone) (yt) t Cu baza fixa Cu baza in lant
nivelul absolut (∆t/0)=yt-y0 ∆t/t-1=yt-yt-1
1992 120 1 - -
1993 116 2 -4 -4
1994 122 3 2 6
1995 144 4 24 22
1996 145 5 25 1
1997 164 6 44 19
1998 175 7 55 11
1999 176 8 56 1
2000 178 9 58 2
total 1340 - 58
(Volumul absolut)

INDICATORI ABSOLUTI: - masoara variatia variabilei in unitatea de masura a


acesteia

A. Nivelul absolut- (yt)


y2=116-> Productia de aluminiu in anul 1993 a fost de 116 mii tone.
y3 = 122 - > Productia de alumiu in anul 1194 a fost de 122 mii tone.

B. Volumul absolut - (Σyt)


Productia de aluminiu in perioada 1992-2000 a fost de 1340 mii tone.

C. Sporul absolut - Δt
- arata cu cat s-a modificat nivelul unei variabile la un moemnt curent(t), fata de un alt moment
anterior, numit moment de referinta.

251
 Sporul absolut cu baza fixa: ∆t/0 = yt-y0:
∆2/0= -4 -> Productia de aluminiu in 1993 fata de 1992 a scazut cu 4 mii tone .
∆3/0= 2 -> Productia de aluminiu in 1994 fata de 1992 a crescut 2 mii tone.

 Sporul absolut cu baza in lant: ∆t/t-1=yt -yt-1


- Momentul de referinta este perioada anterioara perioadei curente.
∆3/2 = 6 - > Productia de aluminiu in 1994 fata de 1993 a crescut cu 6 mii tone .
∆2/1 = -4 -> Productia de aluminiu a scazut in anul 1993 cu 4 mii tone fata de productia din 1992.

252
Rata de Rata de crestere
crestere(sporului) (sporului)
Producția de Rata(indicele) Rata(indicele) de Baza fixa Baza mobila
aluminiu de variație variație
Anul t rt/0= 𝛥 t/0/y0(*100) rt/t-1= 𝛥 t/t-1/yt-1(*100)
( mii tone) (yt) Cu baza fixa Cu baza mobila
it/0=yt/y0 it/t-1=yt/yt-1 sau sau
nivelul absolut
it/0-1(*100) it/t-1-1(*100)

1992 120 1 1 1
1993 116 2 0,96 0,96 -4(0,96-1*100) -4(096-1*100)
1994 122 3 1,01 1,05 1(1.01-1*100) 5(1.05-1*100)
1995 144 4 1,20 1,18 20(1.2-1*100) 18(1.18-1*100)
1996 145 5 1,20 1,00 20(1.20-1*100) 0(1.00-1*100)
1997 164 6 1,36 1,13 36.(1.36-1*100) 13(1.13-1*100
1998 175 7 1,45 1,06 45(1.45-1*100) 6(1.06-1*100)
1999 176 8 1,46 1,00 46(1.46-1*100) 0(1.00-1*100)
2000 178 9 1,48 1,01 48(1.48-1*100) 1(1.01-1*100)
total 1340 - -
(Volumul
absolut)

INDICATORI (INDICI) RELATIVI:


A. Rata(indiciele) de variație - it: arată de câte ori s-a modificat nivelul unei variabile
într-un moment faţă de alt moment (de referinţă)

Daca it >1, atunci fenomenul a inregistrat o crestere in momenul t fata de alt moment
Daca 0< it <1, atunci fenomenul a inregistrat o scadere in momenul t fata de alt moment

𝑦
 Rata (indicele) de variatie cu baza fixa: 𝑖𝑡/0 = 𝑦𝑡 (𝑥100)
0
- Perioada de referinta = y0 = y1992=120
i2/0 = 0.96 - > Productia de aluminiu in 1993 fata de 1992 a scazut de 0.96 ori.
sau
i2/0 = 0.96*100 =96% - > Productia de aluminiu din 1993 reprezintă 96% din productia din anul
1992
i3/0 = 1.01 -> Productia de aluminiu a crescut in 1994 de 1.01 ori fata de productia din 1993.
sau
i3/0 = 1.01*100 = 101% -> Productia de aluminiu din 1994 reprezinta 101% din productia din anul
1993.

253
𝑦𝑡
 Rata (indicele) de variație cu baza in lant: 𝑖𝑡/𝑡−1 = 𝑦 (𝑥100)
𝑡−1

i3/2 = 1.05-> Productia de alumiu in 1994 fata de 1993 a crescut de 1.05 ori.
sau
i3/2 = 1.05*100 = 105% -> Productia de alumiu din 1994 reprezinta 105% din productia din anul
1993
I4/3 = 1.18 - > Productia de aluminiu a crescut in 1995 de 1.18 ori fata de productia din anul 1994.
sau
I4/3 = 1.18*100 = 118% - > Productia de aluminiu din 1995 reprezinta 118% din productia din anul
1994.

B. Rata sporului (de crestere) - rt: exprimă cu cât s-a modificat, în mărime relativă
nivelul fenomenului Y în momentul curent, t, faţă de un alt moment (de referinţă).

Daca rt >0, atunci fenomenul a inregistrat o crestere in momenul t fata de alt moment
Daca rt <0, atunci fenomenul a inregistrat o scadere in momenul t fata de alt moment
 Rata sporului (de crestere) cu baza fixa:
𝛥𝑡/0 𝑦𝑡 −𝑦0
𝑟𝑡/0 = (𝑥100) = (𝑥100) = 𝑖𝑡/0 − 1 (𝑥100)
𝑦0 𝑦0

r2/0 = -4 -> Productia de aluminiu a scazut cu 4% in anul 1993 fata de 1992.


r4/0 = 20 -> Productia de aluminiu a crescut cu 20% in anul 1995 fata de 1992.
r7/0 = 45 - > Productia de aluminiu a crescut in 1998 cu 45% fata de productia din 1992.

 Rata sporului (de crestere) cu baza in lant (mobila):


𝛥𝑡/𝑡−1 𝑦𝑡 − 𝑦𝑡−1
𝑟𝑡/𝑡−1 = (𝑥100) = (𝑥100) = 𝑖𝑡/𝑡−1 − 1 (𝑥100)
𝑦𝑡−1 𝑦𝑡−1
r4/3 = 18 -> Productia de alumiu a crescut in anul 1995 fata de 1994 cu 18%.
r6/5 = 13-> Productia de aluminiu a crescut in 1997 cu 13% fata de productia din 1996.

INDICATORI MEDII:
∑ 𝒚𝒕
A. Nivelul mediu - 𝒚̄ = :
𝒏

254
1340
𝑦̄ = = 148.88 -> Pe perioada analizata, productia medie anuala de aluminiu a fost de 148.88
9
mii tone.
𝜟 𝒚𝒏−𝒚𝟏
B. Sporul mediu - 𝜟̄ = 𝒏−𝟏
𝒏/𝟏
= 𝒏−𝟏
:
Δn/0 yn −y1 178−120 58
Δ̄ = n−1 = n−1 = 9−1 = 8 = 7.25 mii tone -> In medie, cresterea anuala in perioada 1992-
2000 a fost de 7,25 mii tone.
∑Δ 58
Δ̄ = t/t−1 = = 7.25 mii tone -> In medie, in perioada 1992-2000, productia de aluminiu a
n−1 8
crescut cu 7.25 mii tone anual.

𝑛−1 𝑦𝑛
C. Rata medie de variatie: 𝑖̄ = √𝑦 (y0 este tot una cu y1)
0

𝑛−1 𝑛𝑦 𝑛 𝑛−1 𝑦 9−1 178 8 178


𝑖̄ = √ 𝑦 = √𝑦 = √ 120=√120 =1.05
0 1

In medie, in perioada 1992-2000, productia de aluminiu a crescut cu 1.05 ori anual.

D. Rata medie a sporului: 𝑟̅ = 𝑖̅ – 1(x100)


𝑟̅ = (1.05-1)*100=5% - Productia s-a modificat in medie 5% anual.
Sau
In medie, in perioada 1992-2000, productia de aluminiu a crescut 5% anual.

In concluzie:
 Cum ne dam seama ce indicator trebuie calculat?
 Cand se compara o perioada cu alta perioada:
 Daca vrem sa aflam cu cate unitati a crescut sau a scazut y, atunci se
calculeaza sporul absolut
 Daca vrem sa aflam de cate ori a crescut/scazut y, se calculeaza rata de
variatie
 Daca vrem sa aflam cu cat % a crescut / scazut y, se calculeaza rata sporului

 Cand analizam variatia pe toata perioada considerata, in medie:


 Daca vrem sa aflam cu cate unitati a crescut sau a scazut y, atunci se
calculeaza sporul mediu absolut
 Daca vrem sa aflam de cate ori a crescut/scazut y, se calculeaza rata medie de
variatie
 Daca vrem sa aflam cu cat % a crescut / scazut y, se calculeaza rata medie a
sporului

255
Ex1. Consumul anual de lapte (l) din România a cunoscut în perioada 1992-1998
următoarea evoluție:

Anul Consumul (l) t ∆t/0 ∆t/t-1


(yt)
1992 163,7 1 - -
1993 176,9 2 176.9-163.7=13.2 176.9-163.7=13.2
1994 179,5 3 179.5-163.7=15.8 179.5-176.9=2.6
1995 188,6 4 188.6-163.7=24.9 188.6-179.5=9.1
1996 192,7 5 192.7-163.7=29 192.7-188.6=4.1
1997 192,4 6 192.4-163.7=28.7 192.4-192.7=-0.3
1998 194,4 7 194.4-163.7=30.7 194.4-192.4=2
1288.2 30.7

Anul Consumul t it/0 it/t-1 rt/0 rt/t-1


(yt)
1992 163,7 1 1 1
1993 176,9 2 176.9/163.7=1.08 176.9/163.7=1.08 1.08-1(*100)=8 1.08-1(*100)=8
1994 179,5 3 179.5/163.7=1.09 179.5/176.9=1.01 1.09-1(*100)=9 1.01-1(*100)=1
1995 188,6 4 188.6/163.7=1.15 188.6/179.5=1.05 15 5
1996 192,7 5 192.7/163.7=1.17 192.7/188.6=1.02 17 2
1997 192,4 6 192.4/163.7=1.17 192.4/192.7=0.99 17 0.99-1(*100)= -1
1998 194,4 7 194.4/163.7=1.18 194.4/192.4=1.01 18 1

1288.2
Nivelul mediu: 𝑦̄ = =184.02
7

Sporul mediu:
yn −y1 194.4−163.7 30.7
Δ̄ = n−1 = = 6 = 5.11
7−1

∑ Δt/t−1 30.7
Δ̄ = n−1 = 6 = 5.11 

Rata medie de variatie:

𝑛−1 𝑛 𝑦 7−1 194.4 6


𝑖̄ = √𝑦 = √163.7=√1.18 =1.02
1

Rata medie a sporului:


𝑟̅ = (1.02-1)*100= 2

256
TIPURI DE ÎNTREBĂRI GRILĂ

pentru examenul disciplinei ”Bazele statisticii”

1) La un examen, punctajele obţinute de studenţi sunt distribuite normal cu media 500 şi abaterea
standard 100. Un student a obţinut punctajul X = 650. Ce procent din studenţi au obţinut un
punctaj mai mare decât el?

a) 4,3%

b) 1,5%

c) 6,7%

2) Pentru o variabilă X ~ N(12,4), P( 10  X  13 ) este:

a) 0,289

b) 0,532

c) 0,341

3) Într-un sondaj aleator simplu de 400 studenţi, pentru variabila nota la un test, s-a obţinut o
valoare medie de 8,25 şi o abatere standard de eşantion modificată egală cu 1,8. Intervalul de
încredere pentru parametrul medie, cu o probabilitate de 0,95, este

a) (7,5260 - 9,3424)

b) (8,1280 - 9,2020)

c) (8,0736 - 8,4264)

4) În urma prelucrării datelor privind venitul lunar (sute euro) realizat pentru un eşantion de
persoane, s-au obţinut următoarele rezultate:

Column1

Mean 10

Standard Error 0.730297

257
Median 9

Mode 9

Standard Deviation 2.309401

Sample Variance 5.333333

Kurtosis 1.36942

Skewness 1.082532

Minimum 7

Maximum 15

Sum 100

Count 10

Confidence Level(95.0%) 1.652046

Pentru un risc de 0.05, sunt corecte afirmaţiile:

a) intervalul de încredere pentru venitul mediu al populaţiei este (8.35; 11.65)

b) există diferenţe semnificative între venitul mediu al populaţiei şi venitul mediu al ţărilor din UE,
de 15 sute euro;

c) eroarea maxim admisibilă este de 1.652

d) se respinge ipoteza H0: μ=15.

5) Se testează diferenţele dintre veniturile medii din 2 regiuni, A şi B, şi se obţin următoarele


rezultate: tcalc=8,23, numărul gradelor de libertate=25. Pentru un risc de 5%, sunt adevărate
afirmaţiile:

a) valoarea teoretică a statisticii test este egală cu 1,960

b) suma volumelor celor două eşantioane este 27

c) există diferenţe semnificative între veniturile medii din cele 2 regiuni

d) ipoteza H0 este  1   2   3

6). Nivelul vânzărilor unei firme a înregistrat în perioada 2010 - 2013 următoarea evoluţie:

Anii 2010 2011 2012 2013

258
Volumul vânzărilor ( mld. lei ) 2 8 10 12

Sunt corecte afirmaţiile:

a) vânzările firmei au crescut în 2013 faţă de 2011 cu 50%

b) vânzările firmei au crescut în 2013 faţă de 2011 cu 150%

c) vânzările firmei au crescut în 2012 faţă de 2011 de 1,25 ori

7). Nivelul cifrei de afaceri (mld.lei) a unei firme pe trimestre a înregistrat în perioada 2010-2011
următoarea evoluţie:

2010 2011

Trim. I 1 3

Trim. II 3 5

Trim. III 2 4

Trim. IV 4 7

Ştiind că i  2 ,98 , sunt corecte afirmaţiile:


a) cifra de afaceri medie a firmei a fost de 3,625 mld. lei pe an;

b) cifra de afaceri medie a firmei a crescut în medie cu 0,85 mld. lei pe trimestru;

c) cifra de afaceri a firmei a crescut în medie cu 198% pe trimestru.

8). Aplicând metoda ANOVA s-au obţinut următoarele rezultate:

Sursa variaţiei Suma pătratelor variaţiei Grade de libertate

Intergrupe 2

Intragrupe 320

Totală 440 202

259
Variabila numerică este "Salariul", iar variabila (factorul) de grupare este "Regiunea". În această
situaţie, considerând un risc de 0,05, se poate afirma că:

a) se garantează cu o probabilitate de 0,95 că factorul de grupare are o influenţă semnificativă


asupra variaţiei salariului

b) ipoteza H0 este  1   2   3

c) se respinge ipoteza H0

9). Un estimator este nedeplasat dacă:


a). M (ˆ)  

b). V (ˆ)   când n  N

c). are varianţa cea mai mică posibil faţă de varianţa oricărui alt estimator calculat pentru acelaşi
eşantion

10). Pentru un eşantion de persoane se cunosc următoarele rezultate:

sexul_pers

Cumulative
Frequency Percent Valid Percent Percent
Valid Masculin 4 40.0 40.0 40.0
Feminin 6 60.0 60.0 100.0
Total 10 100.0 100.0

Considerând un risc de 0,10, să se calculeze limitele intervalului de încredere pentru proporţia


persoanelor de sex feminin la nivelul populaţiei.

11). Pentru aplicarea metodei ANOVA, trebuie îndeplinite următoarele condiţii:

a) condiţia de normalitate

b) condiţia de homoscedasticitate

c) condiţia de independenţă

12). Variaţia explicată măsoară

a) variaţia sub influenţa factorilor esenţiali (de grupare)

260
b) variaţia sub influenţa factorilor aleatori (întâmplători)

c) variaţia sub influenţa factorilor esenţiali şi aleatori (întâmplători)

13). Aplicând metoda ANOVA, s-au obţinut următoarele rezultate:

Sursa variaţiei Suma pătratelor Grade de libertate


variaţiei

Explicată (intergrupe) 130 4

Reziduală (intragrupe) 250 95

Sunt corecte afirmaţiile:

a) volumul eşantionului este de 95 unităţi

b) numărul de grupe ale factorului de grupare este 5

c) numărul gradelor de libertate asociate variaţiei totale este 99

14). Aplicând metoda ANOVA s-au obţinut următoarele rezultate:

Sursa variaţiei Suma pătratelor variaţiei Grade de libertate

Explicată (intergrupe) 350

Reziduală (intragrupe) 21

Totală 500 24

Variabila numerică este "Salariul", iar variabila (factorul) de grupare este "Regiunea". În această
situaţie, se poate afirma că:

a) valoarea calculată a statisticii F este 16,33

b) ipoteza H0 este
1   2   3   4

c) se garantează cu o probabilitate de 0,95 că factorul de grupare are o influenţă semnificativă


asupra variaţiei salariului

261
15. Aplicând metoda ANOVA s-au obţinut următoarele rezultate:

Sursa variaţiei Suma pătratelor Grade de Estimatori ai


variaţiei libertate varianţei

Explicată (intergrupe) 150 2 75

Reziduală (intragrupe) 65 17 3,823

Variabila numerică este "Venitul", iar variabila (factorul) de grupare este "Regiunea". În această
situaţie, se poate afirma că:

a) există diferenţe semnificative între veniturile medii pe regiuni la nivelul populaţiilor, pentru un
risc de 5%

b) valoarea teoretică a a statisticii F, considerând un risc de 0,05, este 3,592

c) se respinge ipoteza H 0 : 1   2  3

262

S-ar putea să vă placă și