Carte Statistica 2010 Gogu Emilia UCDC

Descărcați ca pdf sau txt
Descărcați ca pdf sau txt
Sunteți pe pagina 1din 37

CONF. UNIV. DR.

EMILIA GOGU STATISTICA

STATISTICA TEORETICĂ

Conf. univ. dr. Emilia Gogu

CUPRINS:

1. CAPITOLUL 1. NOłIUNI INTRODUCTIVE ............................................................. 3


1.1. Scurt istoric al apariŃiei şi dezvoltării statisticii............................................................. 3
1.2. Obiectul şi metoda statisticii........................................................................................... 4
1.3. Concepte de bază folosite în procesul de cercetare statistică ........................................ 5

2. CAPITOLUL 2. PRELUCRAREA PRIMARĂ A DATELOR STATISTICE ŞI


PREZENTAREA INFORMAłIILOR OBłINUTE. .............................................................. 6
2.1. Prelucrarea statistică ...................................................................................................... 6
2.2. Gruparea şi clasificarea datelor statistice ...................................................................... 7
2.3. Prezentarea datelor statistice ......................................................................................... 8

3. CAPTOLUL 3. INDICATORII RELATIVI ÎN STATISTICA SOCIAL


ECONOMICĂ ........................................................................................................................ 10
3.1. NoŃiune. DefiniŃie. ......................................................................................................... 10
3.2. Tipuri de mărimi relative ............................................................................................. 10

4. INDICATORII TENDINłEI CENTRALE, VARIAłIEI ŞI ASIMETRIEI ............. 13


4.1. Analiza seriilor de repartiŃie (distribuŃie) unidimensionale ........................................ 13
4.2. Indicatori de nivel şi de frecvenŃe ai seriilor de repartiŃie.......................................... 13
4.3. Indicatorii tendinŃei centrale ........................................................................................ 14
4.1.1. Mărimile medii......................................................................................................... 14
4.1.2. Valori medii de poziŃie sau de structură .................................................................... 15
4.4. Indicatorii variaŃiei ....................................................................................................... 15
4.5. Media şi dispersia caracteristicii alternative ............................................................... 16
4.6. Asimetria ....................................................................................................................... 18
4.7. Indicatorii concentrării / diversificării......................................................................... 22

5. CAPITOLUL 5. ANALIZA SERIILOR STATISTICE INTERDEPENDENTE,


REGRESIA ŞI CORELAłIA STATISTICĂ........................................................................ 24
5.1. Tipuri de legături între fenomenele social-economice ................................................. 25
5.2. Metode şi procedee de verificare şi analiză a legăturilor statistice ............................. 27
5.3. Metode analitice (parametrice) de măsurare şi interpretare a legăturilor statistice.. 28

1
CONF. UNIV. DR. EMILIA GOGU STATISTICA

6. CAPITOLUL 6. ANALIZA STATISTICĂ A SERIILOR CRONOLOGICĂ ........... 30


6.1. Seriile cronologice formate din indicatori absoluŃi...................................................... 32
6.2. Serii cronologice formate din indicatori relativi.......................................................... 32
6.3. Serii cronologice formate din indicatori medii ............................................................ 32
6.4. Serii cronologice de intervale (perioade) de timp ........................................................ 33
6.5. Ajustarea seriilor cronologice....................................................................................... 34
6.6. Extrapolarea seriilor cronologice ................................................................................. 37

2
CONF. UNIV. DR. EMILIA GOGU STATISTICA

1. CAPITOLUL 1. NOłIUNI INTRODUCTIVE

1.1. Scurt istoric al apariŃiei şi dezvoltării statisticii

Cuvântul statistică are o semnificaŃie multiplă pentru cercetători, specialişti, studenŃi şi


populaŃie în general. Pentru cei mai mulŃi, statistica înseamnă doar o “descriere numerică” a unor
date culese despre fenomenele de masă.
De-a lungul istoriei, datele au fost permanent colectate. În timpul civilizaŃiei egiptene,
greceşti şi romane datele erau obŃinute în scopul primar al taxării şi înrolării în armată.
Astfel, în antichitate (cu 4-5 milenii î.e.n.) se întâlnesc forme de evidenŃă ce pot fi
asimilate înŃelesului modern de recensăminte statistice, în special în China, Egipt, Grecia şi în
Imperiul Roman. Recensămintele efectuate de romani (din 5 în 5 ani apoi din 10 în 10 ani) erau
cunoscute sub denumirea de “cens”. În Dacia, ocupată de romani, evidenŃele care se făceau
asupra populaŃiei, producŃiei şi consumului purtau denumirea de “tabularium”.
Se dezvoltă, de asemenea, evidenŃa cu caracter demografic. În Evul Mediu, instituŃiile
bisericeşti, strângeau adesea şi păstrau informaŃii privind căsătoriile, naşterile, decesele.
Pe măsură ce s-au format statele civilizate statistica s-a diferenŃiat faŃă de formele de
evidenŃă contabilă.
InformaŃiile şi datele statistice cu care intrăm în contact zilnic şi pe baza cărora se iau
decizii sunt de cele mai multe ori rezultatul statisticii.
De regulă statistica ia naştere prin numărarea şi măsurarea acelor fenomene care se
produc şi se reproduc într-un număr mare de cazuri
Nu orice expresie numerică obŃinută în urma măsurării şi numărării este statistica sau
are de-a face cu statistica. CondiŃia necesara este existenŃa unor fenomene de masă. Statistica se
ocupă cu studiul fenomenelor de masă care se mai numesc şi fenomene de tip colectiv, incerte
indeterministe sau statistice.
Fenomenele de masă prezintă anumite trăsături:
 se produc într-un anumit număr de cazuri.
 prezintă un anumit grad de variabilitate în timp şi în spaŃiu.
 fenomene multicauzale
 sunt guvernate de legi statistice, legi care acŃionează ca tendinŃă şi ele pot fi cunoscute
şi verificate numai la nivelul ansamblului.
Statistica studiază latura cantitativă a fenomenelor social-economice de masă în strânsă
legătură cu latura calitativă.
Statistica studiază dimensiunea (mărimea) unui fenomen, structura şi mutaŃiile de
atribuire intervenite în timp, dinamica (evoluŃia în timp) lui şi relaŃiile de interdependenŃă cu alte
fenomene
Pentru studierea fenomenelor statistice folosim metode generale (deducŃia şi inducŃia) şi
metode proprii. Pornind de la particularităŃile obiectului de studiu statistica şi-a elaborat de-a
lungul timpului şi o metoda proprie de cercetare. Metoda statisticii constă în totalitatea
procedeelor şi tehnicilor de culegere a datelor individuale de masă, de sistematizare şi prelucrare
a lor şi de analiză şi interpretare a rezultatelor prelucrării.
Ca disciplină de învăŃământ statistica se diferenŃiază în teoria statisticii (statistica
generală, statistica teoretică) care este formată din procedee şi metode elaborate de ea şi folosită
pentru culegere, prelucrare şi analiză a datelor individuale de masă şi statistica economică care
constă în aplicarea metodelor statistice la studiul concret al fenomenelor economice şi sociale.

3
CONF. UNIV. DR. EMILIA GOGU STATISTICA

Statistica poate fi privită şi tratată ca o disciplină metodologică şi ea este totalitatea


procedeelor şi metodelor utilizate pentru obŃinerea, sistematizarea şi prelucrarea unui număr
mare de date empirice (reale) în scopul obŃinerii unui număr redus de expresii relevante pentru
întregul ansamblu studiat.
Statistica este importantă pentru economişti şi nu numai, deoarece ea permite
comprimarea unui număr mare de date individuale într-un număr mic de indicatori cu ajutorul
cărora evidenŃiem ceea ce este esenŃial în nivelul de dezvoltare al fenomenului studiat.
Statistica fiind o disciplină metodologică se poate astfel aplica în diferite domenii de
activitate. Indiferent de domeniul de aplicare este necesar ca statistica să opereze cu un sistem
unitar de concepte.
Se poate afirma că statistica a apărut în necesitatea de a cunoaşte, în expresie numerică, o
serie de fenomene, procese şi activităŃi social-economice.
Modul de gândire statistic ne impune să acceptăm că datele sunt în mod inerent variabile.
Astfel gândirea statistică poate fi definită ca totalitatea ideilor orientate asupra căilor de
înŃelegere, control şi reducere a variaŃiei.
În procesul istoric de conturare a statisticii moderne pot fi mai multe momente:
 statistica practică
 statistica descriptivă - care servea pentru descrierea aspectelor numerice ale
populaŃiei şi ale statului. Parte a statisticii ce rezumă datele empirice (intuitive, experimentale,
practic, direct) privind fenomenele de masă investigate.
 aritmetica politică – înseamnă elaborarea unor concepte în care societatea este
privită în ansamblul ei. Apar astfel noŃiuni de valoare medie şi de tendinŃe. Cele mai multe studii
în această perioadă, s-au făcut pentru demografie, privind mişcarea populaŃiei. Astfel pe baza
unui număr mare de date s-a elaborat pentru prima dată o regularitate cu privire la proporŃia
dintre naşteri şi decese, separat pentru populaŃie feminină şi cea masculină.
Ex. Ca tendinŃă generală, la 1000 de fete se nasc 1005 băieŃi, dar probabilitatea de
supravieŃuire este mai mică la băieŃi, astfel încât raportul dintre fetiŃe şi băieŃi este în jurul a
51% de sex feminin şi 49% sex masculin, ceea ce însemnă că speranŃa de viaŃă este mai mare
pentru femei.
 calculul probabilităŃilor (statistica matematică) – se ocupă cu elaborarea unor
noŃiuni şi modele valabile pentru orice domeniu din natură, societate sau tehnologie.
Statistica reprezintă arta şi ştiinŃa colectării şi înŃelegerii datelor ce caracterizează
fenomenele de masă.

1.2. Obiectul şi metoda statisticii

Obiectul statisticii îl constituie studiul fenomenelor şi proceselor social-economice care


prezintă următoarele particularităŃi:
 Se produc într-un număr suficient de mare de cazuri (sunt fenomene de masă);
 Variază de la un element la altul, de la caz la altul;
 Sunt forme individuale de manifestare în timp, în spaŃiu şi ca formă de organizare.
Rezultă deci că obiectul de studiu al statisticii îl constituie fenomenele de masa care
prezintă proprietatea de a fi variabile ca forma de manifestare individuală în timp, în spaŃiu şi sub
raport organizatoric.
Spre deosebire de fenomenele simple, fenomenele de masă se produc sub influenŃa unor
factori sistematici sau întâmplători, esenŃiali sau neesentiali, de acelaşi sens sau de sensuri
diferite şi au la baza legile de tip statistic. Pentru a cerceta şi verifică o lege statistică este necesar
să fie analizate toate manifestările individuale ale fenomenului supus cercetării. In acest mod se
creează condiŃiile necesare pentru manifestarea legii numerelor mari.

4
CONF. UNIV. DR. EMILIA GOGU STATISTICA

Legea numerelor mari este un principiu fundamental al cercetării statistice care presupune
luarea în considerare a unei colectivităŃi suficient de numeroase de cazuri individuale, astfel încât
abaterile întâmplătoare, intr-un sens sau altul, se poate compensa, punându-se în evidenta o
anumita marime/valoare care este tipica pentru întreaga colectivitate.
DefiniŃie. "Statistica este ştiinŃa care studiază aspectele cantitative ale determinărilor
calitative ale fenomenelor de masă, fenomene care sunt supuse acŃiunii legilor statistice ce se
manifesta în condiŃii concrete, variabile în timp şi spaŃiu. "
Fenomenele de masă se mai numesc şi :
 fenomene de tip colectiv deoarece legea este valabilă pentru întregul ansamblu şi
numai întâmplător se verifică în fiecare caz în parte,
 fenomene de tip statistic sau stochastic pentru că ele se supun legilor statistice1;
 fenomene aleatoare pentru că între factorii de influenŃă există şi o componenŃă
aleatoare,
 fenomene atipice pentru că forma lor de manifestare individuală este diferită;
 fenomene nedeterministe ca urmare a faptului că modul de asociere a factorilor
esenŃiali cu cei neesenŃiali, a celor sistematici cu cei aleatori se poate schimba în timp, în spaŃiu
sau ca formă organizaŃională,

Principala proprietate a acestor fenomene este variabilitatea în timp, spaŃiu şi ca formă de


organizare, dar care potrivit legii numerelor mari ea se compensează reciproc faŃă de linia
generală de tendinŃă (ce exprimă esenŃialitatea fenomenelor legitatea lor de apariŃie şi
dezvoltare).
Fenomenele de masă se întâlnesc în toate comportamentele vieŃii economice şi sociale şi
ele nu pot fi studiate decât cu ajutorul metodelor statistice. Rezultatele cercetării lor se regăsesc
în datele statistice publicate de Institutul NaŃional de Statistică în anuare, breviare şi buletine
statistice precum şi în diferite studii publicate în edituri şi reviste de specialitate şi de
OrganizaŃiile InternaŃionale.
Urmărind etapele oricărui proces de cunoaştere, pentru rezolvarea problemelor care fac
obiectul sau de studiu, statistica, ca orice ştiinŃa, şi-a elaborat procedee şi metode speciale de
cercetare.
Metoda statisticii este formată din totalitatea procedeelor şi operaŃiilor specifici de
culegere, prelucrare şi analiză statistică a fenomenelor din realitatea economică şi socială în
cadrul cărora activează legile statistice.
Complexitatea şi amploarea cercetării statistice fac necesară perfecŃionarea continuă a
metodelor de observare, prelucrare şi analiză. Dezvoltarea metodelor statisticii este strâns legată
de progresele înregistrate în teoria probabilităŃilor, statistica matematică şi în domeniul
informaticii. Necesitatea prelucrării unui volum mare de date a dus la dezvoltarea maşinilor de
calul şi implicit la formarea programelor de calul. (Ex. EXCEL, Statistic, SPPS, SAS.)

1.3. Concepte de bază folosite în procesul de cercetare statistică


În statistică se folosesc o serie de noŃiuni (concepte) de bază cu care se operează în toate
etapele cercetării şi în toate statisticile aplicate:
a) Colectivitatea (populaŃia) statistică
b) Unitate statistică:
c) Caracteristici (variabile) statistice
d) Date şi indicatori statistici.
e) Măsurarea statistică
1
Legea statistică – lege care acŃionează în cadrul unui ansamblu de unităŃi, de fenomene sau de
procese de aceiaşi esenŃă şi exprimă valoarea medie, predominantă purtată de majoritatea
elementelor unui ansamblu distribuit după o variabilă.
5
CONF. UNIV. DR. EMILIA GOGU STATISTICA

f) Estimare statistică.
g) Eroare statistică

2. CAPITOLUL 2. PRELUCRAREA PRIMARĂ A DATELOR


STATISTICE ŞI PREZENTAREA INFORMAłIILOR OBłINUTE.

2.1. Prelucrarea statistică


Prelucrarea statistica – este un proces prin care datele înregistrate sunt
sistematizate şi tratate statistic în vederea obŃinerii sistemului de indicatori statistici.
ObŃinerea indicatorilor statistici este necesară pentru caracterizarea în expresii numerice
generalizatoare, a ceea ce este esenŃial pentru un grup de unităŃi sau pentru întreaga
colectivitate, studiate în condiŃii de timp şi de spaŃiu.
Prelucrarea primară înseamnă în acelaşi timp şi centralizarea, sistematizarea şi
omogenizarea datelor observării în vederea aplicării modelelor de calcul şi analiză
satistică
Sistematizarea datelor înregistrate presupune ordonarea acestora în funcŃie de
omogenitatea lor.
Deci la baza sistematizării se află principiul omogenităŃii. (Ex. pentru formularea
unei idei sau a unei fraze de compliment – cuvintele trebuiesc alese (grupate), sau
(clasificarea studenŃilor după notele obŃinute la examenul de statistică). Principiul
omogenităŃii este un principiu de pierdere a informaŃiei pentru a câştiga informaŃie.
Însăşi sistematizarea se realizează prin :
a) centralizarea şi
b) gruparea statistica a datelor.
a) centralizarea – presupune totalizarea unităŃilor statistice sau a valorilor unei
caracteristici la nivelul grupelor tipice sau al colectivităŃii observate. Totalizarea
valorilor unei caracteristici se face prin însumarea directa sau prin folosirea unor
coeficienŃi de echivalenta (preturi, timpul de munca etc.) În urma centralizării
obŃinem mult doriŃii indicatori statistici de nivel (ex, nr. populaŃiei unei localităŃi,
valoarea producŃiei)
• Centralizarea simplă şi obŃinerea indicatorilor (agregatelor) generali
Nr.crt. Variabile însumabile direct
al unităŃii X1 X2 … Xp
1 x11 x21 … xp1
2 x12 x22 … xp2
… … … … …
i x1i x2i … xpi
… … … … …
n x1n x2n … xpn
Total n n
… n
∑ x1i ∑ x2 i ∑ x pi
i =1 i =1 i =1

6
CONF. UNIV. DR. EMILIA GOGU STATISTICA

Pe orizontală se găseşte fiecare unitate cu toate variantele înregistrate la toate


caracteristicile (variabilele) înregistrate, iar pe verticală sunt distribuŃiile de valori ale
celor p variabile independente înregistrate.

2.2. Gruparea şi clasificarea datelor statistice


Gruparea statistică – este o centralizare pe grupe a unităŃilor unei colectivităŃii.
Se obŃine în baza aplicării metodei grupărilor statistice presupunând principiul
omogenităŃii.
Omogenitatea statistică înseamnă ca în grupa (clasa) respectivă să existe variaŃie
minimă între variantele înregistrate – variaŃie care poate fi explicată ca fiind influenŃa
factorilor aleatori.
În forma grupării statistice – rezultă şiruri de date ordonate după variaŃie, în sens
crescător sau descrescător, a caracteristicilor de grupare.
 După conŃinutul caracteristicii de grupare putem avea:
• grupări cronologice în cazul în care sistematizarea datelor se face după o
variabilă de timp;
• grupări teritoriale când sistematizarea datelor se face după o variabilă de
spaŃiu;
• grupări atributive se folosesc pentru toate caracteristicile, în afara
caracteristicilor de timp şi spaŃiu.
Caracteristicile atributive pot fi caracteristici cantitative (numerice) şi calitative
(nenumerice).
 După numărul variabilelor de grupare pot fi: simple şi combinate.
Grupările simple (după o singură variabilă .) pot fi:
a) gruparea pe variante dacă amplitudinea variaŃiei este mică şi la nivelul
unităŃilor individuale s-au înregistrat un număr mic de valori distincte
(variante);
b)
c) gruparea pe intervale de variaŃie egale dacă amplitudinea variaŃiei este
moderată. În acest caz, e necesar, să se stabilească numărul de grupe şi mărimea
intervalului de variaŃie.

c) gruparea pe intervale de variaŃie neegale. Prin gruparea pe intervale neegale se


urmăreşte să se structureze colectivitatea pe tipuri calitative, dacă nu se cunosc
valorile (pragurile) care separă tipurile calitative, se procedează mai întâi la
gruparea pe intervale egale şi apoi se poate folosi criteriul mediei pentru formarea
tipurilor calitative “mic”, “mediu”, “mare”. In acest caz se obŃine o grupare
tipologică.

Gruparea combinată presupune sistematizarea datelor după două sau mai multe
caracteristici de grupare (cel mult 4) care pot fi variabile numerice şi/sau calitative.
Gruparea combinată impune stabilirea ordinii de grupare pe baza relaŃiei de
interdependenŃă dintre variabile. Grupele formate după prima caracteristică se regrupează
după cea de a doua ş.a.m.d.
Clasificarea (gruparea pentru variabile calitative) se efectuează după variabile
nenumerice (calitative) şi presupune includerea în aceeaşi grupă (clasă) a tuturor

7
CONF. UNIV. DR. EMILIA GOGU STATISTICA

unităŃilor la care s-a înregistrat aceeaşi formă de manifestare a caracteristicii. De regulă,


are un caracter oficial (ex. CAEN) şi în prealabil trebuie stabilit un nomenclator al
claselor.

2.3. Prezentarea datelor statistice


Rezultatul sistematizării necesită o prezentare sub o forma cât mai comod de
manevrat şi vizualizat, sub forma de :
a) serii,
b) tabele
c) grafice.

a) Seriile statistice
Enumerarea datelor statistice într-o anumită ordine se numeşte serie statistică.
Seria statistică se reprezintă ca două şiruri de date. Primul şir este criteriul de enumerare
(valori , variante) al doilea şir conŃine datele numerice.
Seriile statistice sunt de următoarele feluri
1. Serii de repartiŃie sau de distribuŃie
2. Serii cronologice (ale dinamicii )sau serii de timp.
3. Serii teritoriale sau de spaŃiu.
4. Serii descriptive sau enumerative (lista candidaŃilor admişi, facultatea, media de
liceu , media examenelor, şcoala absolvită etc.)
5. Serii unidimensionale şi multidimensionale
La rândul lor seriile statistice pot fi atât numerice (cantitative) cât şi nenumerice
(calitative).

b) Tabele statistice. Prezentarea datelor sub forma unui tabel statistic permite atât o
bună vizualizare cât şi mai ales, efectuarea diverselor calcule în procesul de prelucrare a
datelor.
Pot fi tabele cu o singură intrare şi cu două sau mai multe intrări, tabele de lucru şi
de prezentare a rezultatelor.
În elaborarea unui tabel se identifică următoarele elemente şi reguli principale:
 titlul tabelului
 macheta tabelului
 subiectul tabelului - colectivitatea şi componentele ei
 predicatul tabelului - constituie variantele şi indicatorii cu care caracterizăm statistic
colectivitatea studiată.
 Unitatea de măsură
 Sursa datelor (sub tabel)
 Numerotarea tabelelor (sus)
c) Reprezentări grafice – Cu ajutorul graficilor se vizualizează informaŃiile statistice
facilitând perceperea pe ansamblu a datelor, aspecte privind: variaŃia valorilor observate,
repartiŃia lor, legăturile existente între ele, a evoluŃiei valorilor în timp ş.a.
Graficul trebuie să cuprindă:
 Titlul – (precizându-se şi limitele fenomenului)
 Legenda
 Sistemul axelor rectingulare (ox, oy, oz)
Principalele tipuri de grafice sunt:
8
CONF. UNIV. DR. EMILIA GOGU STATISTICA

 grafice de volum
 grafice de structură
 grafice prin benzi
 grafice prin coloane simple sau în aflux
 cronogramă (historiogramă) pe scară uniformă sau logaritmică
 diagrama polară (radială)
 histograma
 poligonul frecvenŃelor
 curba cumulativă a frecvenŃelor
 graficul lui Lorentz
 cartograma
 cartodiagrama.

9
CONF. UNIV. DR. EMILIA GOGU STATISTICA

3. CAPTOLUL 3. INDICATORII RELATIVI ÎN STATISTICA SOCIAL


ECONOMICĂ

3.1. NoŃiune. DefiniŃie.


Indicatorii relativi se obŃin prin aplicarea unui model de comparaŃie sub formă de raport.
Deci prin mărimi relative înŃelegem rezultatul raportării a doi indicatori absoluŃi.
Indicatorul din numărătorul raportului se numeşte indicatorul raportat, iar cel din numitor,
indicatorul bază de raportate. Alegerea bazei raportate se face în funcŃie de scopul comparării.
Mărimile relative se pot exprima prin coeficienŃi, %, promile, prodecimile cât şi
procentimile.
nr.nãscuti vii
Ex. Natalitatea = ⋅ 1000 (5 născuŃi la 1000 persoane); nr
nr mediu al populatiei
medicilor ce revine la 10.000 locuitori . Mai rar se întâlnesc exprimării în procentimile, adică
cât unităŃi din indicatorul raportat revin la 100.000 unităŃi bază de raportare.
Alegerea formei de exprimare se face astfel încât mărimile relative să fie sugestive. Dar
forma cea mai obişnuită de exprimare a lor este cea a procentelor care arata câte unităŃi din
indicatorul raportat revin la 100 unităŃi ale indicatorului baza de raportare.
Forma de exprimare a mărimilor relative se stabileşte în raport cu gradul de variaŃie al
fenomenelor, a scopului urmărit, precum si particularităŃile specifice fenomenului cercetat.
Pentru calculul unei mărimi relative, trebuie respectate 3 cerinŃe:
a) între termenii comparaŃi trebuie să existe o legătură firească de condiŃionare sau de
cauzalitate;
b) termenii comparaŃi să fie cu adevărat comparabili din punctul de vedere al sferei de
cuprindere, ca metodologie de calcul etc;
c) baza de comparaŃie să aibă o anumită semnificaŃie în evoluŃia fenomenului studiat.

În cea mai mare parte mărimile relative în satistică nu prezintă o dificultate de calcul. Cele
mai multe dificultăŃi apar în comparaŃiile internaŃionale, unde indicatorii provin din diferite surse
sau sunt calculaŃi după metodologii diferite.

3.2. Tipuri de mărimi relative


În principal se pot calcula următoarele tipuri de mărimi relative:
a) de structura;
b) de coordonare (corespondenŃă);
c) de ale dinamicii;
d) ale planului (programării).
e) de intensitate
a) Mărimea relativă de structură se poate calcula de fiecare dată când s-a aplicat metoda
grupării prin urmare calculul lor este posibil atunci când colectivitate este separată înde
două sau mai multe grupe. Este un raport dintre o parte la întreg (total).

xi
x *i = * 100
∑ xi
- daca se determina pentru frecventa fiecărei grupe se numesc ponderi iar daca se
determina pentru valorile centralizate ale diferitelor caracteristici se numesc greutăŃi specifice

10
CONF. UNIV. DR. EMILIA GOGU STATISTICA

specifice care se obŃin ca mărimi relative de structură raportând frecvenŃa fiecărei grupe (ni , fi )
k k
la totalul frecvenŃelor ( ∑n ,∑ f
i =1
i
i =1
i ) după relaŃia:

fi ni
- f i (%) * = k
* 100; ni (%) * = k
* 100 .
∑f
i =1
i ∑n
i =1
i

FrecvenŃele relative permit analiza structurii unei serii de distribuŃie în funcŃie de una sau
mai multe variabile (caracteristici) şi compararea repartiŃiilor empirice cu cele teoretice.
Având caracter de mărimi relative se pot exprima sub formă de coeficienŃi sau în
procente şi fiind “eliberate” de aspectul concret al exprimării unităŃilor centralizate pe grupe
devin comparabile pentru orice fel de serie şi mai ales cu probabilităŃile din distribuŃiile teoretice.

b) Mărimile relative de coordonare sau corespondenŃă caracterizează raportul numeric în


care se găsesc doi indicatori cu acelaşi conŃinut în spaŃii diferite coexistente în timp.
Pentru o colectivitate împărŃită în două grupe pentru care nivelul pe grupe al variabilei
studiate este xA şi xB :
X X
Forma de prezentare ar fi: : K A / B = A sauK B / A = B
XB XA
unde: A şi B unităŃi teritoriale.
XA şi XB nivelul colectivităŃii de raportate din unitatea A res
Mărimi relative de coordonare se pot calcula şi pornind de la frecvenŃe:
nA n
K A/ B = sau K B / A = B
nB nA
De regulă ei se exprimă în coeficienŃi.

c) ale dinamicii – se obŃine ca raport a doi indicatori al aceluiaşi fenomen dar aflate între
două momente /perioade diferite.
Pentru a studia în dinamică recurgem la serii cronologice.
În generale o serie statistică este formată din 2 şiruri de date în care I şir reprezintă criteriul de
sistematizare (factorul e grupare) al II -lea şir variabila dependentă de factorul de grupare
Analiza se face atât în bază fixă cât şi mobilă (în lanŃ).
*Indicatorii relativi obŃinuŃi prin raportare exprimă indicele de variaŃie
X
- cu bază fixă K i / 0 = i *100
X0
XI
- cu bază mobilă (în lanŃ) K i / i −1 = * 100
X i −1
Putem calcula mărimi relative ale dinamicii la nivelul ansamblului, dacă variabila este
aditivă direct:

kt / 0 =
∑x t
respectiv k t / t −1 =
∑x t

∑x 0 ∑x t −1

Ele se exprimă atât sub formă de coeficienŃi dar mai adesea sub formă % .
Reprezentarea grafică: Mărimile relative d. se reprezintă grafic prin:
- cronograme (histograme)

d) Mărimile relative ale programării (planificării)

11
CONF. UNIV. DR. EMILIA GOGU STATISTICA

Se calculează la nivelul unităŃilor economice fiind necesar să se elaboreze programe de


aprovizionare, producŃie şi desfacere pe termene scurte sau mai lungi.
Calculul mărimilor relative ale planului presupune preluarea din evidenŃele unităŃii
economice analizate a informaŃiilor referitoare la:
• nivelul fenomenului analizat în perioada de bază (x0);
• nivelul planificat (programat) în perioada curentă (xpl)
• nivelul realizat în perioada curentă (x1).
Din compararea sub formă de raport a celor trei indicatori rezultă:
x pl
• - coeficientul sarcinii de plan: k pl / 0 =
x0
x1
• - coeficientul îndeplinirii planului: k 1 / pl =
x pl
x1
• - coeficientul de dinamică: k 1 / 0 =
x0
Între cei trei coeficienŃi există relaŃia:
• k 1 / 0 = k pl / 0 . k1 / pl
Interpretarea valorii mărimilor relative ale planului ca şi a ratei de depăşire (nerealizare) se face
în raport cu conŃinutul economic al indicatorului (de creştere sau de reducere obiectivă a
fenomenului).
Putem calcula mărimi relative ale planului la nivel de ansamblu, pentru variabile
însumabile direct:

• k pl / 0 =
∑ x pl ∑x
k1 / pl =
1
respectiv
∑ x0 ∑x pl

De cele mai multe ori mărimile relative de dinamică şi mărimile relative ale planului se
exprimă procentual.

e) Mărimile relative de intensitate se obŃin prin raportarea a doi indicatori absoluŃi de natura
diferita, dar care se află într-un raport de interdependenŃă.
RelaŃia de calcul este:
• la nivel parŃial: X = Y i
Zi
Aceste mărimi se pot calcula pentru fiecare grupa de unităŃi în parte sau pentru întreaga
colectivitate.

• la nivelul ansamblului: X i =
∑ YI sau x = ∑ X i Z i
∑ Zi ∑Zi
Ex: Densitatea populaŃiei (loc/km2,) Productivitatea muncii (lei/munc).
Mărimile relative de intensitate au numerose aplicaŃii în:
- industrie ( coeficientul mecanizării, automatizării, utilizării intensive etc.)
- agricultură (coeficientul chimizări, irigaŃiilor, recolta medie la ha);
- turism (indicatorii eficienŃei activităŃii de turism, productivitatea muncii etc)
- demografice (coeficientul mişcării naturale, migratorii a populaŃiei)

12
CONF. UNIV. DR. EMILIA GOGU STATISTICA

4. INDICATORII TENDINłEI CENTRALE, VARIAłIEI ŞI


ASIMETRIEI

4.1. Analiza seriilor de repartiŃie (distribuŃie) unidimensionale

Rezultatul grupării şi clasificării unităŃilor colectivităŃii observate în funcŃie de


caracteristici atributive cantitative sau calitative se prezintă sub forma seriilor de repartiŃie
(distribuŃie) empirică. Ele se mai numesc simplu repartiŃii sau distribuŃii statistice.
Grupările simple (după o singură caracteristică) conduc la serii statistice independente
sau unidimensionale, iar cele combinate la serii statistice condiŃionate sau multidimensionale.
La calculul şi analiza indicatorilor (parametrilor) distribuŃiilor empirice trebuie avute în
vedere o serie de proprietăŃi, care se pot întâlni în toate cazurile, dar cu forme specifice fiecărei
serii. MenŃionăm în continuare principalele proprietăŃi ale unei serii de repartiŃie: variabilitatea,
omogenitatea, independenŃa şi concentrarea/dispersia către/faŃă de una sau mai multe valori ale
seriei care stau la baza indicatorilor cu care definim (descriem) seria.
Variabilitatea termenilor unei serii statistice de repartiŃie este determinată de faptul că
fenomenele de masă pe care le prezintă nu sunt fenomene univoc determinate, ci ele apar ca
rezultat al acŃiunii combinate a mai multor cauze, unele cu caracter esenŃial, altele cu caracter
întâmplător, care se manifestă, de regulă, în condiŃii individuale diferite. Cu cât acŃiunea cauzelor
aleatoare este mai puternică, cu atât variabilitatea termenilor este mai mare iar gradul de
omogenitate este mai mic.
Omogenitatea termenilor unei serii de repartiŃie se explică prin faptul că toate valorile au
acelaşi conŃinut, depinzând de acelaşi factor esenŃial. Omogenitatea statistică care poate fi
explicată prin influenŃa aleatoare a componenŃei factorilor presupune o variaŃie minimă între
termeni. RepartiŃiile empirice pot avea omogenităŃi diferite în funcŃie de modul de combinare a
factorilor care determină variabila studiată şi ele trebuie măsurate prin indicatori statistici
corespunzători.
Dacă în urma analizei statistice se constată că seria nu prezintă omogenitate, se trage
concluzia că această colectivitate este formată din mai multe tipuri calitative şi deci, seria
respectivă trebuie separată în două sau mai multe serii componente. În situaŃii de acest gen este
necesar să se verifice în ce măsură tendinŃa generală de variaŃie din întreaga colectivitate se
regăseşte în forma de variaŃie specifică fiecărei grupe şi să se interpreteze acŃiunea sistematică a
factorilor esenŃiali la nivelul fiecărei grupe şi pe ansamblu. Se vor folosi şi în acest scop
indicatori medii de variaŃie şi asimetrie parŃiali şi totali prezentaŃi în subcapitolele următoare.
IndependenŃa termenilor unei serii de repartiŃie de frecvenŃe provine din faptul că fiecare
valoare individuală se înregistrează pentru o unitate statistică ce reprezintă un element distinct ş i
obiectiv al unei colectivităŃi statistice. Această independenŃă este relativă deoarece unităŃile
statistice aparŃinând aceleiaşi colectivităŃi se supun aceloraşi legi care se manifestă sub formă de
tendinŃă. FaŃă de aceasta tendinŃă există abateri într-un sens sau altul, care pentru un număr mare
de cazuri, se compensează reciproc. De aceea, este necesar ca prin metode statistice
corespunzătoare, să se afle trăsăturile esenŃiale şi comune care leagă aceste valori individuale
relativ independente, dar care aparŃin aceleaşi structuri calitative şi care în statistică este
cunoscută sub denumirea de ,,legea de repartiŃie a seriei “.

4.2. Indicatori de nivel şi de frecvenŃe ai seriilor de repartiŃie

Caracterizarea statistică a unui fenomen de masă într-o colectivitate statistică presupune


luarea în consideraŃie atât a valorilor individuale (ca forme concrete de manifestare) cât şi a

13
CONF. UNIV. DR. EMILIA GOGU STATISTICA

frecvenŃelor de apariŃie a acestora. În acest sens, fiecare serie are o structură condiŃionată de
valorile pe care le ia caracteristica (variabila) în condiŃiile date de timp, spaŃiu şi organizatorice.
De aceea, analiza seriilor de repartiŃie debutează de obicei cu calculul indicatorilor determinaŃ i
pe baza frecvenŃelor de apariŃie ale valorilor individuale ale caracteristicii.
Indicatorii de nivel ai seriei pot fi exprimaŃi în cazul variabilelor numerice prin variante
în cazul grupării pe variante. În cazul intervalelor de variaŃie se utilizează ca indicator de nivel
centrul (mijlocul) intervalului de grupare.
În grupa indicatorilor de frecvenŃă deosebim: frecvenŃe absolute, frecvenŃe relative ş i
frecvenŃe cumulate.
FrecvenŃele absolute notate în unele lucrări cu "fi" sau "ni " în altele, reprezintă numărul
de unităŃi care corespunde grupelor de unităŃi (variante sau intervale de valori) obŃinut ca rezultat
al centralizării statistice. FrecvenŃele absolute se exprimă în unităŃi concrete (număr de salariaŃi,
număr de agenŃi comerciali, număr de unităŃi turistice, număr de depunători CEC etc.).
FrecvenŃele absolute stau la baza calculului frecvenŃelor relative.
FrecvenŃele relative permit analiza structurii unei serii de distribuŃie în funcŃie de una sau
mai multe variabile (caracteristici) şi compararea repartiŃiilor empirice cu cele teoretice.
FrecvenŃele cumulate sunt comparabile între ele indiferent de felul de intervalului de
grupare. De asemenea ele stau la baza stabilirii medianei şi a celorlalte medii de structură sau
poziŃie – indicatori care vor fi prezentaŃi într-un subcapitol din acest capitol.

4.3. Indicatorii tendinŃei centrale


Analiza statistică a trăsăturilor esenŃiale ale fenomenelor de masă, stabilirea tendinŃelor
ce apar în producerea lor necesită calcularea anumitor valori sintetice cu conŃinut de valori tipice,
care să fie reprezentative pentru întreaga serie studiată.
În funcŃie de gradul de variabilitate a valorilor individuale, de sursele de date de care
dispunem şi de nevoile de cunoaştere, în teoria şi practica statistică se utilizează ca principali
indicatori ai tendinŃei centrale: mărimile medii; mediana; şi modul (dominanta) seriei.

4.1.1. Mărimile medii


Media în statistică reprezintă principalul indicator sintetic cu care se caracterizează un
număr mare de valori individuale diferite ca forme de manifestare dar având acelaşi conŃinut. În
consecinŃă, mărimile medii sunt utilizate ca instrumente principale de cunoaştere a fenomenelor
de masă, deoarece numai pe baza lor se poate exprima ceea ce este comun şi general în forma de
manifestare a acestor fenomene, în fiecare etapă dată, prin eliminarea a ceea ce este întâmplător
şi neesenŃial în producerea lor.
In analiza seriilor de repartiŃie de frecvenŃe se pot calcula următoarele tipuri de medii:
- media aritmetică ( x a sau dacă nu se mai foloseşte şi altă medie simplă x );
- media armonica ( x h );
- media pătratica ( x p );
- media geometrică ( x g ).
Fiecare poate fi calculată ca medie simplă şi ca medie ponderată.
Mediile simple se folosesc în cazul datelor negrupate sau când repartiŃiile au intervale cu
frecvenŃe egale între ele şi deci se pot simplifica.
Mediile ponderate se utilizează pentru repartiŃiile în care fiecărei valori a caracteristicii i
se ataşează o frecvenŃă care diferă de la caz la caz.
In statistica social-economică , cel mai frecvent se foloseşte media aritmetică.

14
CONF. UNIV. DR. EMILIA GOGU STATISTICA

4.1.2. Valori medii de poziŃie sau de structură

Mărimile medii fiind o sinteză a tuturor valorilor seriei reflectă ceea ce este esenŃial ş i
tipic în nivelul de dezvoltare a fenomenului fără să caracterizeze şi modul de repartiŃie a
frecvenŃelor în cadrul seriei.
De aceea, pentru completarea analizei seriilor de distribuŃie este necesar să se calculeze ş i
anumite valori medii de poziŃie sau medii de structură, care să evidenŃieze şi forma de repartiŃie a
frecvenŃelor. Dintre acestea, mediana şi modul sunt cel mai frecvent utilizate, fiind considerate
tot ca indicatori ai tendinŃei centrale.
Mediana (Me) reprezintă valoarea centrală a unei serii statistice, ordonate crescător sau
descrescător, care împarte termenii seriei în două părŃi egale.
Indiferent de tipul seriei (simplă sau cu frecvenŃe) la calculul medianei se cer rezolvate
două
Modul (Mo) unei distribuŃii statistice reprezint ă acea valoare a caracteristicii care
corespunde celui mai mare efectiv sau celei mai mari frecvenŃe.
Cu alte cuvinte, modul este valoarea cea mai frecvent întâlnită, motiv pentru care mai
este cunoscut în literatura de specialitate şi sub denumirea de dominanta seriei.
Pentru serii simple (date negupate) modul se calculează dacă întâlnim o valoare a
variabilei care se repetă de mai multe ori.
Cuartilele sunt acele valori ale caracteristicii, care separă seria în patru părŃi egale:
cuartila inferioară, notată cu Q1, este mai mare sau egală de 25% din termenii seriei şi
mai mică sau egală de 75% dintre ei;
cuartila a doua Q2 coincide cu Me şi separă seria în două părŃi egale ca efectiv;
cuartila superioară Q3 este mai mare sau egală de 75% din numărul termenilor şi mai
mică sau egală de 25% din numărul lor.

4.4. Indicatorii variaŃiei

Într-o colectivitate statistică valorile individuale (variantele) diferă mai mult sau mai
puŃin unele faŃă de altele. Ele pot fi mai apropiate sau mai împrăştiate. Or după cum s-a precizat
la metodele grupării, valorile pot fi omogene între ele numai dacă prezintă variaŃie minimă ş i
media ca sinteză a acestor valori va fi o valoare tipică, reprezentativă. De aceea, comparaŃia se
face, în principal, cu media aritmetică, considerată ca fiind valoarea cea mai reprezentativă
pentru colectivitatea studiată. De cele mai multe ori este important de cunoscut cât de departe
sunt valorile variantelor seriei faŃă de această medie, sau cu alte cuvinte care este dispersia
variantelor în cadrul seriei sau câmpul de variaŃie a caracteristicii înregistrate.
Se apreciază că dacă variantele au valori mai apropiate de valoarea mediei seriei, deci
prezintă abateri mici, media este reprezentativă.
În practica statistică de cele mai multe ori datele care trebuie să fie analizate sunt extrem
de numeroase şi de regulă cu o amplitudine mare a variaŃiei. De aceea este necesar să separăm ş i
să stabilim intensitatea cu care activează cele două grupe de factori esenŃiali şi întâmplători
având drept consecinŃă imediată un anumit grad de variabilitate.
Dacă am limita analiza numai la determinarea şi interpretarea mărimii medii nu ar fi
posibilă cunoaşterea condiŃiilor concrete în care apar şi se dezvoltă fenomenele şi nici depistarea
tendinŃelor evolutive ale variabilităŃii acestor fenomene.
Cu cât fenomenele sunt mai complexe, deci dependente de mai mulŃi factori, cu atât
variaŃia este mai mare şi utilizarea mărimilor medii devine insuficientă fără verificări riguroase
15
CONF. UNIV. DR. EMILIA GOGU STATISTICA

cu privire la omogenitatea datelor luate în calcul şi în consecinŃă la stabilitatea ş i


reprezentativitatea lor. O medie este considerată în statistică ca fiind reprezentativă numai atunci
când se calculează din valori omogene între ele.
Analiza statistică a unei repartiŃii poate fi aprofundată prin calculul indicatorilor de
variaŃie. Aceşti indicatori trebuie să servească la:
verificarea reprezentativităŃii mediei ca valoare tipică a unei serii de date statistice;
verificarea gradului de omogenitate a seriei;
caracterizarea statistică a formei şi gradului de variaŃie a unei caracteristici;
compararea în timp şi spaŃiu a mai multor serii statistice de distribuŃie pentru aceeaşi
caracteristică sau pentru caracteristici interdependente care au fost înregistrate pentru
aceeaşi colectivitate;
cunoaşterea gradului de influenŃă a factorilor după care s-a făcut gruparea unităŃilor
observate.
Studiul variaŃiei unei serii statistice se bazează în principal pe folosire ca valoarea tipică a
mediei aritmetice . În scopuri speciale, sau pentru completarea analizei variaŃiei se poate
folosi o altă valoare a tendinŃei centrale (mediana, mediala, modul), sau pe zone de
variaŃiei mediile de structură (centilele, decilele).
Indicatorii variaŃiei pot fi calculaŃi ca indicatori simpli şi ca indicatori sintetici.

4.5. Media şi dispersia caracteristicii alternative


În practica de cercetare statistică a fenomenelor social-economice se întâlnesc
caracteristici ale căror variante nu se exprimă numeric (cantitativ) ci prin cuvinte (calitativ) şi nu
admit decât una sau alta dintre alternative. În cazul în care caracteristica urmărită este alternativă
unităŃile colectivităŃii se împart în două: o grupă care cuprinde acele unităŃi la care se
înregistrează forma directă de manifestare a caracteristicii şi o altă parte a colectivităŃii la care se
înregistrează opusul formei de manifestare a caracteristicii. De exemplu: starea unei piese poate
fi bună sau defectă, situaŃia unui student după susŃinerea unui examen poate fi promovat sau
nepromovat, operaŃia unui pacient poate fi reuşită sau nereuşită etc. De menŃionat faptul că orice
caracteristică numerică nealternativă se poate transforma într-o caracteristică alternativă prin
raportarea la medie sau la un anumit prag. În acest caz, unităŃile colectivităŃii se vor separa în
două grupe: unităŃi cu un nivel de dezvoltare mai mic decât media sau decât o valoare aleasă şi a
doua grupă formată din unităŃile cu nivel de dezvoltare mai mare decât media sau peste valoarea
aleasă.
Pentru caracterizarea statistică a variabilelor alternative este necesară o cuantificare a
valorilor. Considerând răspunsurile respective ca fiind cele două variante ale caracteristicii,
pentru exprimarea lor cantitativă s-au stabilit următoarele valori convenŃionale:
pentru DA; x1=1
pentru NU; x2=2
Numărul de unităŃi (frecvenŃele) din cele două grupe este diferit iar distribuŃia lor se
prezintă în tabelul 4.8.
Pentru distribuŃia prezentată în tabel, media caracteristicii se va calcula aplicând relaŃia
mediei aritmetice ponderate, astfel:
1 ⋅ M + 0 ⋅ (N − M ) M
= =p
N + (N − M ) N
Se observă că media caracteristicii alternative reprezintă tocmai frecvenŃa relativă a
răspunsurilor afirmative.
Tabelul 4.8
DISTRIBUłIA DE FRECVENłE A CARACTERISTICII ALTERNATIVE

Valoarea Răspunsul FrecvenŃe absolute FrecvenŃe relative

16
CONF. UNIV. DR. EMILIA GOGU STATISTICA

caracteristicii înregistrat
0 1 2 3
x1 = 1 DA M (numărul unităŃilor care
posedă caracteristica)
x2 = 0 NU (N-M) N−M
q= = 1− p
(numărul de unităŃi care nu N
posedă caracteristica)
Total N=M+(N-M) p+q = 1

Dispersia caracteristicii alternative se obŃine pornind de la relaŃia de calcul obişnuit al


dispersiei, cu frecvenŃe relative, în care se folosesc elementele specifice:
(1 − p ) 2 ⋅ p + (0 − p ) 2 ⋅ q
σ =2

p+q
p

Deoarece p + q = 1, atunci (1 - p) = q şi formula devine:


q 2 ⋅ p + p 2 ⋅ q p ⋅ q ⋅ ( q + p)
σ 2p = = = p ⋅ q = p ⋅ (1 − p)
p+q p+q
deci

σ 2p = p ⋅ q sau σ 2p = p ⋅ (1 − p)

Dispersia caracteristicii alternative este egală cu produsul dintre cele două frecvenŃe
relative.
Abaterea medie pătratică se determină potrivit metodologiei clasice - ca rădăcină
pătrată din dispersie:
σ p = p⋅q
Aceşti indicatori sunt folosiŃi pe scară largă în cercetările selective şi mai ales în controlul
statistic al calităŃii produselor.
Dispersia şi abaterea medie pătratică a caracteristicii alternative prezintă anumite
particularităŃi:
a) dispersia poate lua numai valori cuprinse în intervalul 0 ≤ σ 2p ≤ 0,25 iar abaterea
medie pătratică numai valori cuprinse în intervalul 0 ≤ σ p ≤ 0,5 ;

b) când p=q dispersia şi abaterea standard ating valorile maxime: σ 2p = 0,25; σ p = 0,5;

c) dacă p<q şi p creşte uniform în cadrul intervalului: 0 < p < 0,5 atât σ 2p cât şi σ p
înregistrează o creştere mai rapidă la început şi mai lentă către limita superioară;
d) dacă p > q şi p continuă să crească uniform în cadrul intervalului: 0,5 < p < 1,
dispersia şi abaterea medie pătratică înregistrează o scădere în acelaşi ritm în care a avut loc şi
creşterea.
În cazul în care colectivitatea este împărŃită în grupe şi se studiază variaŃia unei
caracteristici alternative, atunci se calculează dispersiile din fiecare grupă, media lor, dispersia
dintre grupe şi dispersia colectivităŃii totale, după formulele:
Dispersia de grupă pentru o caracteristică alternativă ( σ 2pi ) se calculează după
relaŃia:

σ 2p = pi qi sau σ 2p = pi (1 − pi )
i i

în care :
17
CONF. UNIV. DR. EMILIA GOGU STATISTICA

pi - reprezintă mediile caracteristicii alternative din fiecare grupă;


qi - frecvenŃele relative ale unităŃilor care nu posedă caracteristica în fiecare grupă.
Media dispersiilor de grupă (σ 2p ) se calculează ca o medie ponderată a dispersiilor
grupelor în care a fost împărŃită colectivitatea:
r

∑(p q )N i i i
σ = 2
p
i =1
r

∑N i
i =1
în care Ni - reprezintă numărul total al unităŃilor observate în fiecare grupă.
Dispersia dintre grupe pentru o caracteristică alternativă (δ p2 ) se calculează pe baza
abaterilor mediilor caracteristicii alternative din fiecare grupă şi media pe întreaga colectivitate:
r
∑ ( pi − p) N i
2

δ p2 = i =1
r
∑ Ni
i =1
M
în care p este media caracteristicii alternative pe întreaga colectivitate ( p =).
N
Dispersia totală a caracteristicii alternative (σ 2p ) se calculează pe baza celor două
greutăŃi specifice (p, q) din colectivitatea totală:
σ p2 = p ⋅ q
Regula adunării dispersiilor se păstrează şi în cazul unei caracteristici alternative:
σ 2p = σ p2 + δ p2

4.6. Asimetria
Pentru caracterizarea seriilor de distribuŃie unidimensionale şi unimodale un interes
deosebit îl prezintă şi cunoaşterea gradului de oblicitate, de îndepărtare a acestor distribuŃii de la
simetrie. În practica statistică acest aspect este cunoscut sub numele de asimetrie.
La interpretarea gradului de asimetrie se porneşte de la poziŃia şi valorile pe care le au cei
trei indicatori ai tendinŃei centrale: media, mediana şi modul prin raportare la proprietăŃile
distribuŃiei normale.
Într-o distribuŃie simetrică cei trei indicatori: mod, mediană şi media aritmetică se
confundă ca în diagrama din figura 4.8.

y y

x x
Mo = Me = x Mo < Me < x
Figura 4.8 Figura 4.9

18
CONF. UNIV. DR. EMILIA GOGU STATISTICA

x
x < Me < Mo
Figura 4.10

O distribuŃie nonsimetrică se mai numeşte şi oblică şi ea poate prezenta asimetrie de


stânga sau de dreapta (vezi figurile 4.9 şi 4.10).
Forma repartiŃiei se poate analiza:
a) utilizând metoda grafică;
b) calculând indicatorii de asimetrie adecvaŃi.
Asimetria se poate analiza în primul rând cu ajutorul metodei grafice. În acest scop se
folosesc: poligonul frecvenŃelor şi histograma. După ce s-a construit poligonul frecvenŃelor
interpretarea se face ca mai sus.
La interpretarea asimetriei şi în general a formei de repartiŃie se folosesc proprietăŃile
distribuŃiei normale. DistribuŃia normală (curba lui Laplace, Gauss) face parte din cadrul
distribuŃiilor în care curba frecvenŃelor se prezintă sub forma unui clopot în secŃiune
longitudinală în care frecvenŃele de apariŃie ale unei variabile X scad proporŃional şi simetric în
raport cu frecvenŃa maximă, care corespunde valorii centrale. În graficul distribuŃiei normale,
ordonata maximă corespunde unui punct pe abscisă în care valoarea caracteristicii este egală cu
media, mediana şi modulul seriei.
Legea distribuŃiei normale a fost descoperită de peste 200 de ani de De Moivre. La
începutul secolului XIX a fost descoperită independent de Gauss şi Laplace, care au definit
proprietăŃile acestui tip de distribuŃie, deosebit de utile pentru interpretarea statistică a
fenomenelor de tip colectiv. Fundamentarea observării selective, aplicarea analizei dispersionale,
determinarea intervalelor de încredere în cadrul cărora se pot plasa diferiŃi indicatori statistici
etc. nu pot fi realizate fără a Ńine seama de proprietăŃile distribuŃiei normale.
DistribuŃia normală poate fi considerată ca o distribuŃie model, în cadrul căreia se pot
determina teoretic care sunt frecvenŃele de apariŃie a diferitelor valori ale unei variabile aleatoare
X sau valorile acesteia, dacă se presupun cunoscute frecvenŃele acestora. Variabila aleatoare –
după cum s-a mai spus – este acea caracteristica care poate lua un număr mare de valori
individuale diferite, ca urmare a faptului că apariŃia lor este determinată de influenŃa
concomitentă a mai multor factori. Aceste valori pot să apară o singură dată sau de mai multe ori
şi prin centralizarea datelor se obŃine distribuŃia de frecvenŃă. În cercetarea statistică se operează
cu caracteristici care iau forma unor variabile aleatoare în care trebuie să se Ńină seama atât de
nivelurile atinse cât şi de frecvenŃa lor de apariŃie.
În cazul distribuŃiei normale – după cum s-a mai arătat - frecvenŃele de apariŃie ale
diferitelor variante în raport cu frecvenŃa de apariŃie a mediei colectivităŃii se distribuie în mod
simetric. Sub forma grafică distribuŃia normală se prezintă ca o curbă continuă, simetrică faŃă de
ordonata maximă care trece prin vârful curbei şi care corespunde punctului de pe abscisă egal cu
valoarea mediei şi a medianei. În acelaşi timp, distribuŃia normală poate fi considerată şi ca o
funcŃie matematică în care frecvenŃele sale se exprimă în raport cu variaŃia caracteristicii X, deci:
y=f(x)
în care: y – frecvenŃele de apariŃie ale nivelelor individuale ale caracteristicii;
x - valorile individuale ale variabilei aleatoare pentru care se analizează seria
de distribuŃie.

19
CONF. UNIV. DR. EMILIA GOGU STATISTICA

În cazul distribuŃiei normale, de tip teoretic, valorile caracteristicii X pot lua valori de la
-∞ la +∞. Pentru a uşura înŃelegerea acestui tip de distribuŃie se consideră în mod convenŃional
ca origine a variaŃiei caracteristicii X, valoarea ei medie ( x =0), iar pe grafic se vor reprezenta
abaterile individuale ale caracteristicii X faŃă de media seriei (xi- x ), Ńinând seama de frecvenŃele
lor de apariŃie. În acelaşi timp, se vor considera frecvenŃele de apariŃie a diferitelor valori ale
caracteristicii X drept frecvenŃe relative, care în cazul distribuŃiei teoretice se transformă în
probabilit ăŃi de apariŃie. În cazul distribuŃiei normale teoretice suma probabilităŃilor de apariŃie a
tuturor valorilor caracteristicii (X) este egală cu 1.
Pe baza celor arătate şi considerând pe x =0, probabilităŃile de apariŃie se vor distribui în
mod simetric de ambele părŃi ale ordonatei maxime. Pe baza acestei probabilităŃi s-au determinat
care sunt probabilit ăŃile de apariŃie a diferitelor abateri (xi- x ), considerând ca erori faŃă de
medie, corespunzătoare ordonatei dispuse la un anumit interval faŃă de ordonata maximă, adică:
( xi − x ) 2
1 −
yi = ⋅e 2σ 2

σ 2Π
în care:
yi – probabilitatea de apariŃie a abaterii (xi- x ),
σ2 – dispersia caracteristicii x;
σ - abaterea medie pătratică a caracteristici X
Π =3,14
e – baza logaritmilor naturali =2,71828
xi- x - abaterea individuală a caracteristicii Xde la media lor, considerată ca o valoare
scontată câtre care tinde să se concentreze întreaga distribuŃie de frecvenŃă.
În mod corespunzător se poate determina şi valoarea ordonatei maxime unde abaterea (xi-
x ), este egală cu zero, deci:
1
y0 =
σ 2Π
în care y0 – ordonata maximă considerată în punctul central al seriei.
Aplicate unei serii empirice, aceste formule de calcul servesc la determinarea
frecvenŃelor relative teoretice de apariŃie a diferitelor valori ale caracteristicii, considerată ca
fiind distribuită normal dacă pentru o serie de distribuŃie se cunoaşte media şi abaterea medie
pătratică.
Dacă se cunoaşte şi volumul colectivităŃii (N) în locul frecvenŃelor teoretice relative se
pot determina frecvenŃele teoretice absolute înlocuind pe 1 (suma frecvenŃelor relative) cu N
(volumul absolut al întregii colectivităŃi). În acest caz frecvenŃa teoretică absolută
corespunzătoare unui punct definită prin axa absciselor prin abaterea sa faŃă de mediei va fi:
( xi − x ) 2
N −
yi = ⋅e 2σ 2

σ 2Π
Interpretând această formulă rezultă că în cazul distribuŃiei normale, forma de distribuŃie
depinde în principal de valorile luate de abaterea media pătratică (σ). Dacă abaterea medie
pătratică are o valoare mare, ea corespunde unei variaŃii mari a termenilor seriilor în jurul mediei
şi deci gradul de alungire a curbei este mai mare şi invers, deoarece în acest caz abaterile (x- x )
nu fac decât să se mute dintr-o parte în alta pe abscisă. Din această cauză aria de întindere a
curbei se poate măsura în unităŃi de abatere normate determinate ca raport între abaterile
x−x
individuale şi abaterea medie tip ( )
σ
În cazul distribuŃiei normale se demonstrează în mod teoretic, că între distribuŃia dintre
diferitele ordonate şi ordonata maximă există o anumită proporŃionalitate şi aceste relaŃii se
găsesc calculate şi tabelate. Ele corespund diferitelor probabilităŃi de apariŃie a diferitelor valori
în raport cu media şi abaterea lor medie pătratică. Aceasta înseamnă că diferitele valori şi
20
CONF. UNIV. DR. EMILIA GOGU STATISTICA

probabilitatea lor de apariŃie se pot măsura în unit ăŃi de abateri tip şi că, deci, pot fi calculate ş i
interpretate în sens probabilistic fără să fie necesară cunoaşterea distribuŃiei empirice, cu condiŃia
ca variabila să urmeze legea de distribuŃie normală a erorilor.
Într-o distribuŃie normală, cu probabilităŃi de apariŃie perfect simetrice într-un sens şi altul
se poate observa pe grafic că punctele de curbură ale curbei se găsesc în dreptul ordonatelor
corespunzătoare unităŃilor de măsură ale abaterii medii pătratice şi mărimea medie.

Principalele proprietăŃi ale distribuŃiei normale pot fi astfel enumerate:


1. DistribuŃia normală este simetrică şi continuă, şi indică o colectivitate a cărei
caracteristică este de forma unei variabile aleatoare ale cărei valori oscilează în jurul unei valori
centrale ce poate fi calculată ca o medie aritmetică din valorile individuale ale caracteristicii.
Între valorile individuale şi mărimea lor medie există o relaŃie de compensare reciprocă a
abaterilor într-un sens sau altul, pe baza unor probabilităŃi teoretice egale pentru aceleaşi valori
absolute ale abaterilor.
2. În cadrul unei distribuŃii normale, variabila (X) poate lua orice valoare cuprinsă între
-∞ şi +∞, dar cu probabilităŃi diferite de apariŃie şi anume ele cresc proporŃional şi simetric în
ambele sensuri pe măsură ce se apropie de valoarea lor centrală.
DistribuŃia probabilităŃilor de apariŃie a diferitelor valori ale caracteristicii se pot
determina şi măsura în unităŃi de abateri medii pătratice, deoarece punctele de curbură se găsesc
unde ordonatele corespund diferitelor valori ale caracteristicii măsurate prin unităŃi de abateri tip.
Pe baza acestor relaŃii, dacă distribuŃia este normală, se pot calcula diferitele probabilităŃi de
apariŃie corespunzătoare valorilor care trebuie să fie determinate pentru variabila studiată,
cunoscându-se dinainte media şi abaterea sa medie pătratică, folosind tabelele de calcul ale
funcŃiei lui Laplace.
3. Reprezentarea grafică a curbei distribuŃiei normale arată că ea depinde de mărimea
celor doi parametri care o definesc: media ( x ) şi abaterea medie pătratică (σ). Dintre cei doi
parametrii, influenŃa determinată o are valoarea abaterea mediei pătratice, care poate alungi
graficul în ambele sensuri pe când valoarea medie nu produce decât o translaŃie pe graficul
respectiv.
Cunoaşterea proprietăŃilor distribuŃiei normale este deosebit de importantă de importantă
în interpretarea statistică a fenomenelor. Ea se foloseşte în special în caracterizarea statistică a
seriilor de distribuŃie, în analiza dispersională, la verificarea ipotezelor statistice, la efectuarea
selecŃiilor în vederea caracterizării întregului ansamblu. Pe baza proprietăŃilor distribuŃiei
normale se poate interpreta raportul care există între distribuŃia empirică obŃinută pe baza datelor
din observarea statistică şi distribuŃia teoretică stabilită pe baza proprietăŃilor distribuŃiei
normale. Această raportare nu se poate face decât dacă variabilele care se cercetează prezintă
tendinŃa de distribuŃie simetrică a valorii lor individuale. Pentru a măsura abaterea de la această
tendinŃă se calculează indicatorii asimetriei.
Indicatorii cu ajutorul cărora se interpretează care este gradul de asimetrie se pot exprima
atât în mărimi absolute cât şi în mărimi relative.
Karl Pearson, statistician britanic propune la începutul secolului pentru măsurarea
asimetriei trei coeficienŃi:
C as = 0 ⇒ serie simetrică
x − Mo 
c as = C as > 0 ⇒ serie oblică la stânga
σ C < 0 ⇒ serie oblică la dreapta
 as
Deci, acest coeficient poate lua valori cuprinse între -1 şi +1; cu cât este mai mic în
valoare absolută cu atât asimetria este mai mică.
De reŃinut. Acest coeficient este recomandabil a se folosi numai pentru distribuŃii uşor
asimetrice.

21
CONF. UNIV. DR. EMILIA GOGU STATISTICA

În cazul când se cunoaşte mediana seriei, coeficientul de asimetrie (Cas′ ) se poate


calcula utilizând relaŃia:
3( x − Me)
Cas′ =
σ
Acest coeficient se foloseşte pentru serii uşor asimetrice când între cei trei indicatori ai
tendinŃei centrale se verifică relaŃia:
Modul = Media - 3(Media - Mediană)
Acest coeficient poate să ia valori cuprinse între -3 şi +3 şi va arăta un grad mai mare de
simetrie cu cât se va apropia mai mult de 0.
 As = 0 ⇒ simetrie

Dacă:  As > 0 ⇒ simetrie oblic ă la stanga
 As < 0 ⇒ simetrie oblic ă la dreapta

Dacă acest coeficient se apropie de 0,1 se apreciază că seria este moderat asimetrică, iar
peste 0,3 se consideră că seria este pronunŃat asimetrică.

4.7. Indicatorii concentrării / diversificării


Analiza seriilor de repartiŃie unidimisionale este continuată cu măsurarea gradului de
concentrare a valorilor variabilei. Prin concentrare se înŃelege faptul că o pondere mică (mare)
deŃine o pondere mare (mică) din volumul variabilei.
La caracterizarea statistică a concentrării se pot folosi: metoda grafică, măsurarea
concentrării prin indicatorii concentrării.
Analiza concentrării / diversificării se bazează pe curba de concentrare denumit ă şi curba
lui Lorenz. Această curbă se construieşte pentru repartiŃiile construite pe intervale de grupare.
Construirea acesteia presupune următoarele etape:
1. Calcularea frecvenŃei relative
n
ni * = i ⋅ 100
∑ ni
2. Calculul frecvenŃelor relative cumulate crescător (Fi).
3. Determinarea nivelului totalizat al caracteristicii pe fiecare grupă (xini) şi pe total
colectivitate (Σxini).
4. Determinarea greutăŃii specifice (gi) care exprimă ponderea nivelului totalizator al
fiecărei grupe pe total.
5. Calcularea greutăŃii specifice cumulate crescător (gic).
6. Construirea curbei lui Lorenz.
Acest tip de grafic se construieşte în sistem de axe şi anume în cadranul I. Pe axa OX se
reprezintă frecvenŃele relative cumulate, iar pe axa OY greutăŃile specifice cumulate.
Fiecare pereche de valori (Fi, gic) se reprezintă printr-un punct unind prin segment de
dreaptă doua câte două puncte succesive se obŃine curba de concentrare.
SuprafaŃa mărginită de curba de concentrare şi de dreapta egalităŃii perfecte a frecvenŃelor
(dreapta care uneşte punctele de coordonate (0;0) şi (100;100)) se numeşte arie de concentrare.
Cu cât aceasta este mai mare cu atât concentrarea este mai puternică.
Pentru a reda în expresie numerică gradul de concentrare se calculează indicatori statistici
adecvaŃi.
Cel mai frecvent utilizat este coeficientul de concentrare propus de statisticianul italian
Corado Gini potrivit relaŃiei:

C= ∑g 2
i unde i = 1, n

22
CONF. UNIV. DR. EMILIA GOGU STATISTICA

 1 
Coeficientul Gini ia valori în intervalul  ,1 . Atunci când cele n unităŃi au ponderi
 n 
1
egale în colectivitate, adică repartiŃia studiată este absolut uniformă, rezultă C = , iar dacă
n
variabila cercetată se concentrează într-o singură unitate, C=1.
Pentru a înlătura dezavantajul legat de faptul că limita inferioară a intervalului de variaŃie
a indicatorului este variabilă depenzând de numărul termenilor seriei se foloseşte un alt indicator
propus de R. Struck:
n∑ g i2 − 1
C=
n −1
Interpretarea valorii acestui coeficient se face în intervalul (0;1). Cu cât coeficientul este
mai aproape de limita inferioară, el exprimă o mai uniformă repartizare a elementelor
colectivităŃi pe tipurile calitative observate.
O apropiere de limita superioară sugerează o concentrare pe un anumit tip sau pe câteva
tipuri calitative.

23
CONF. UNIV. DR. EMILIA GOGU STATISTICA

5. CAPITOLUL 5. ANALIZA SERIILOR STATISTICE


INTERDEPENDENTE, REGRESIA ŞI CORELAłIA STATISTICĂ

InterdependenŃa dintre fenomenul şi procesele sociale şi economice, folosind variabile


statistice între care se pot stabili relaŃii ca de la cauză la efect, este studiată de toate ştiinŃele ce
aparŃin domeniului respectiv, printre care se numără şi statistica economică socială.
Complexitatea fenomenelor economice şi sociale, caracterizarea lor cantitativă şi calitativă
determină folosirea combinată a diferitelor ştiinŃe în investigarea relaŃiilor de cauzalitate, care
stau la baza apariŃiei şi dezvoltării lor.
Printre metodele şi modelele care s-au impus in studiul interdependenŃei, corelaŃia şi
regresia statistică sunt cele care se folosesc cel mai frecvent.
Utilizarea acestor metode este justificată de necesitatea crescândă a reflectării într-o formă
numerică adecvată a interdependenŃei obiective dintre fenomenele social-economice în ceea ce
priveşte natura, direcŃia şi gradul de intensitate a legăturilor, care se manifestă într-o anumită
perioadă de timp sau în dinamică.
Teoretic şi practic se demonstrează în mod ştiinŃific că fenomenele sociale apar şi se
dezvoltă ca urmare a unor cauze variate, care pot acŃiona m acelaşi sens sau în sens opus şi cu
grad diferit de intensitate. Complexitatea interacŃiunii dintre fenomene este cu atât mai mare, cu
cât ele aparŃin unor colectivităŃi mai numeroase Reiese că fenomenele sociale nu sunt, de regulă,
fenomene univoc determinate, fiind rezultatul conjugării influenŃei mai multor fenomene-cauză,
iar în sistemul acesta de legături nu toate raporturile de dependenŃă au aceeaşi importanŃă,
acŃiunea unora dintre factori compensându-se reciproc.
De aceea, în analiza statistică a raporturilor de dependenŃă dintre fenomene, problema care
se pune este aceea a măsurării relaŃiei care există între două sau mai multe caracteristici cuprinse
în programul unei cercetări concrete a fenomenelor social-economice de masă. Aceasta
presupune, în primul rând, să se constate dacă între caracteristica x - denumită caracteristica
factorială sau independentă şi caracteristica y caracteristică rezultativă sau dependentă - există
sau nu un raport de dependenŃă şi, în al doilea rând, dacă această relaŃie există să se exprime
printr-un indicator simplu sau sintetic de corelaŃie, măsura în care caracteristica factorială x
contribuie la formarea caracteristicii rezultative y sub aspectul naturii, direcŃiei şi formei de
legătură între ele.
În acest stadiu de cercetare statistică analiza calitativă ce trebuie să preceadă aplicarea
uneia sau a alteia dintre metodele statistice este deosebit de importantă şi are un vădit caracter
interdisciplinar. Aceasta permite ca, din ansamblul de legături existente în mod obiectiv între
fenomenele aceleiaşi colectivităŃi statistice, să se desprindă acelea care au caracter permanent ş i
sunt determinante în formarea nivelurilor concrete de dezvoltare a caracteristicii rezultative.
Acest lucru apare cu atât mai necesar, cu cât legitatea de apariŃie şi dezvoltare a fenomenelor
social-economice fiind valabilă pentru întregul ansamblu, nu este sesizabilă, de obicei, în cadrul
cercetării empirice, decât dacă datele se referă la un număr mare de cazuri individuale concrete,
diferite ca forme de manifestare, aparŃinând aceleiaşi colectivităŃi.
Având în vedere toate aceste aspecte, trebuie precizat că metoda corelaŃiei nu poate da
rezultate bune decât dacă se lucrează cu un număr suficient de mare de cazuri individuale
în care distribuŃia abaterilor este aproximativ normală. Dacă această condiŃie nu este
satisfăcută, câmpul de acŃiune a legii numerelor mari este limitat, iar concluziile desprinse în
urma obŃinerii anumitor indicatori de corelaŃie pot da naştere unei interpretări eronate, ca urmare
a reflectării neveridice a fenomenelor supuse cercetării statistice. Şi cu această ocazie este
necesar ca procesul de analiză să pornească de la simplu la complex, de la fenomene la esenŃă, de
la o esenŃă de un anumit grad la o esenŃă de grad superior.
Aceasta presupune ca, în analiza legăturilor dintre fenomene, să se folosească metoda
abstractizării succesive a factorilor, prin care să se poată studia atât legăturile simple, imediate

24
CONF. UNIV. DR. EMILIA GOGU STATISTICA

dintre două fenomene legate printr-o relaŃie de cauzalitate directă, cât şi interacŃiunea dintre
factori.
Studiul statistic al interdependenŃei dintre fenomene necesită identificarea legăturilor
studiate de la cauză la efect, precum şi legăturile realizate prin intermediul unui şir de cauzalităŃi.
în acest sens, este necesar ca relaŃiile de cauzalitate din interiorul fenomenelor complexe să fie
studiate şi prezentate tot sub o formă de tendinŃă valabilă la nivelul întregului ansamblu şi nu la
nivelul unor valori individuale izolate. Aceasta conduce în mod obligatoriu la folosirea unor
metode statistice m care să se Ńină seama de formele de distribuŃie de frecvenŃă ale fenomenelor
pentru care se studiază interdependenŃele dintre ele şi care nu pot fi interpretate decât pe baza
indicatorilor medii şi a celor de variaŃie.
Înainte de aplicarea modelelor statistice de analiza interdependenŃa, este necesar să facem
distincŃia între corelaŃie şi covariaŃie.
CovariaŃia presupune existenŃa unor forme de repartiŃie în timp, spaŃiu sau organizare,
pentru 2 sau mai multe variabile, dar care sunt independente între ele.
CorelaŃia se poate defini ca interdependenŃa existentă între diferitele fenomene sau
caracteristici exprimate prin numere (cantitativ) sau prin cuvinte (calitativ) manifestată în cadrul
fenomenelor social-economice de masă. CorelaŃia presupune găsirea funcŃiei analitice cu care să
descriem statistic legătura dintre variabilele studiate. Trebuie precizat că metoda corelaŃiei nu
poate da rezultate bune decât dacă se lucrează cu un număr suficient de mare de cazuri
individuale în care distribuŃia abaterilor este aproximativ normală.

5.1. Tipuri de legături între fenomenele social-economice


Formele de manifestare a relaŃiilor de interdependenŃă sunt extrem de variate şi adesea
destul de greu de sesizat. Pentru a le studia este necesar să fie clasificate în funcŃie de unele
criterii, după care se pot deosebi unele de altele.
După natura relaŃiei de cauzalitate, legăturile dintre fenomene pot fi legături funcŃionale şi
legături statistice sau stohastice
1. Legăturile funcŃionale sunt univoce, realizate direct între un fenomen-cauză şi un
fenomen-efect. Deci, fenomenul-efect depinde de o singură cauză, care poate fi identificată de
câte ori se produce, ceea ce înseamnă că, dacă condiŃiile rămân constante, atunci unei valori a
caracteristicii factoriale îi corespunde o singură valoare a caracteristicii rezultative. Ele se mai
numesc şi legături de tip determinist.
RelaŃia matematică dintre fenomenul-efect şi fenomenul-cauză, pentru legăturile de tip
funcŃional (determinist) este: yi=f(xi).
Ex Un exemplu de astfel de legătură funcŃională este aceea dintre nivelul productivităŃii
muncii şi consumul specific de timp de muncă pentru produsul respectiv în cadrul unei perioade
de timp. Se poate, cu uşurinŃă, demonstra că, pe măsură ce scade timpul de producere a unei
mărfi, cu atât creşte productivitatea muncii pentru produsul respectiv.
2. legături statistice, denumite şi legături stohastice, de tip nedeterminist descrise prin
funcŃia matematică : yi = f ( x1i , x2i ,..., xki ) şi se referă la fenomene complexe, influenŃate de
mai multe cauze, care se manifestă în condiŃii diferite.
Legăturile de tip stohastic sunt cele mai frecvente în domeniul fenomenelor sociale şi
economice. în cazul legăturii statistice, identificând un factor de influenŃă, se poate constata că,
pe măsura variaŃiei acestuia, variază într-o măsură mai mare sau mai mică şi caracteristica
apreciată şi dependentă de factorul ales.
De exemplu, legătura dintre înzestrarea tehnică a muncii şi productivitatea muncii este o
legătură de tip statistic. La o creştere a înzestrării tehnice a muncii se obŃine o creştere diferită a
productivităŃii muncii, deoarece productivitatea muncii depinde şi de alŃi factori. Pentru a studia
gradul de dependenŃă a productivităŃii muncii de gradul de înzestrare tehnică este necesar ca aici
să se folosească metoda abstractizării, în care să se considere că numai acest factor ar fi esenŃial

25
CONF. UNIV. DR. EMILIA GOGU STATISTICA

şi variabil, iar ceilalŃi factori ar avea acŃiune comună cu caracter constant, chiar dacă în realitate,
ei au o influenŃă hotărâtoare şi variabilă asupra productivităŃii muncii.
Trebuie remarcat că legăturile de tip statistic pot fi reciproce, adică efectul se transformă,
la rândul lui, în cauză imediată sau mediată prin intermediul unor relaŃii de cauzalitate în lanŃ.
Pentru a studia legăturile de tip statistic este necesar să se identifice şi să se ierarhizeze
factorii esenŃiali, precum şi formele sub care se manifestă relaŃiile de cauzalitate. Acest lucru este
posibil numai dacă se înregistrează toate unităŃile care formează colectivitatea de fenomene ce
depinde de aceleaşi cauze esenŃiale.
Când analiza relaŃiilor de cauzalitate se studiază pe baza unor observări parŃiale este
necesar să se verifice, în prealabil, gradul de reprezentativitate al colectivităŃii de selecŃie şi să se
verifice apoi gradul de semnificaŃie al indicatorilor de corelaŃie care s-au calculat, prin aplicarea
unor teste de semnificaŃie. Şi aici, interpretarea relaŃiilor de cauzalitate, folosind datele de
selecŃie, se face în sens probabilist.
Varietatea formelor de manifestare a legăturilor statistice necesită m continuare o
clasificare a lor după mai multe criterii. Un prim criteriu este acela al numărului factorilor
înregistraŃi.
După numărul caracteristicilor-factori luate în studiu, legăturile statistice pot fi:
legături simple şi legături multiple.
Legăturile simple sunt acelea în care caracteristica rezultativă se studiază numai în funcŃie
de o singură caracteristică factorială considerată principală şi variabilă, iar celelalte caracteristici
factoriale, chiar dacă au fost identificate şi înregistrate, se consideră cu acŃiune constantă în toate
cazurile individuale înregistrate.
Legăturile multiple presupun să se studieze dependenŃa unei caracteristici rezultative în
funcŃie de mai mulŃi factori înregistraŃi. Interpretarea statistică a legăturilor multiple implică ş i
analiza legăturilor simple dintre toate caracteristicile înregistrate pentru calculul corelaŃiei
multiple.
După conŃinutul caracteristicilor incluse în analiza de corelaŃie, legăturile pot fi: de
asociaŃie şi de corelaŃie.
AsociaŃia statistică exprimă relaŃia de interdependenŃă dintre două sau mai multe
caracteristici exprimate calitativ sau între o caracteristică numerică şi una calitativă. De exemplu,
între aptitudini şi profesia aleasă există o legătură de tip stocastic sau între gradul de îndemânare
şi productivitatea muncii.
La folosirea caracteristicilor calitative este necesar să se găsească o posibilitate de
cuantificare, pentru a putea trece apoi la calculul indicatorilor
de corelaŃie.
CorelaŃia statistică exprimă relaŃia de interdependenŃă dintre două sau mai multe
caracteristici exprimate numeric şi se poate măsura prin indicatori statistici de corelaŃie. De
exemplu, între nivelul de productivitate a muncii, vechimea în producŃie şi nivelul salariilor
există legături de corelaŃie, care pot fi analizate atât ca legături simple, cât şi ca o legătură
multiplă.
După direcŃia în care se produc, legăturile pot fi: directe şi inverse.
Legăturile directe sau în acelaşi sens se produc atunci când, pe măsură ce se modifică
nivelul de dezvoltare a caracteristicii factoriale, se modifică în acelaşi sens şi nivelul
caracteristicii rezultative. În exemplul precedent, atât productivitatea muncii, cât şi vechimea în
producŃie influenŃează m acelaşi sens variaŃia salariaŃilor.
Legăturile inverse sunt acelea în care, pe măsură ce se modifice nivelul de dezvoltare a
caracteristicii factoriale, se modifică m sens contrai nivelul caracteristicii rezultative. De
exemplu, între nivelul productivităŃi muncii şi nivelul costului unitar există o legătură statistică
inversă.
După forma legăturii, ele pot fi: rectiliniare, exprimate prin ecuaŃia funcŃiei liniei drepte
şi curbiliniare, exprimate prin ecuaŃia unei funcŃii exponenŃiale, parabolice, hiperbolice etc.

26
CONF. UNIV. DR. EMILIA GOGU STATISTICA

Identificarea formei de realizare a legăturii este determinantă pentru măsurarea corectă a


corelaŃiei dintre fenomenele social-economice.
După timpul în care se realizează, legăturile statistice pot fi: concomitente (sincrone) ş i
cu decalaj (asincrone).
Legăturile sincrone (concomitente) sunt cele care pot fi urmărite în dinamică pentru
aceeaşi perioadă de timp. De exemplu, dacă se analizează corelaŃia dintre dinamica
productivităŃii muncii şi a salariilor, se poate observa că pe măsură ce creşte productivitatea
muncii, creşte şi mărimea salariilor încasate de muncitorii aceleiaşi colectivităŃi statistice.
Legături asincrone (cu decalaj) apar atunci când caracteristicile factoriale încep să
acŃioneze asupra variaŃiei caracteristicii rezultative, după scurgerea unei perioade timp. De
exemplu, între mărimea investiŃiilor în maşini şi instalaŃii şi creşterea productivităŃii muncii
există un decalaj necesar asimilării în masă a noilor tehnologii, sau între dezvoltarea unei ramuri
noi de producŃie şi mărimea exportului există un decalaj corespunzător asigurării competitivităŃii
produselor pe plan internaŃional.
Problemele care trebuie rezolvate în aplicarea metodelor de analiză a corelaŃiilor statistice
pot fi sintetizate astfel:
 identificarea şi ierarhizarea factorilor care determină în mod obiectiv variaŃia
caracteristicii rezultative;
 verificarea gradului de cuprindere a unităŃilor înregistrate. Dacă unităŃile observate provin
dintr-o cercetare parŃială de tip selectiv trebuie ca la interpretarea rezultatelor să se Ńină
seama de principiile teoriei probabilităŃilor;
 sistematizarea datelor observate, astfel încât să nu se modifice gradul şi forma de variaŃie
a caracteristicile la care se aplică metoda corelaŃiei;
 verificarea existenŃei şi formei de legătură dintre caracteristicile corelate, în vederea
alegerii corecte a modelului utilizat la măsurarea dependenŃei statistice;
 calcularea adecvată a indicatorilor de corelaŃie m funcŃie de forma de legătură şi de
natura informaŃiei de care se dispune;
 aplicarea testelor de semnificaŃie a indicatorilor de corelaŃie pentru cazul în care ei provin
dintr-un sondaj statistic.
Interpretarea rezultatelor şi verificarea ipotezelor şi aplicarea testelor de semnificaŃie a
funcŃiilor şi parametrilor lor se face potrivit particularităŃilor fenomenelor studiate în funcŃie de
timp, loc şi formă de organizare.
Dacă datele provin dintr-un sondaj statistic trebuie să se verifice reprezentativitatea
ansamblului şi să se interpreteze probabilistic indicatorii calculaŃi.

5.2. Metode şi procedee de verificare şi analiză a legăturilor


statistice
Aplicarea metodei corelaŃiei pentru cercetarea interdependenŃei dintre fenomenele şi
procesele sociale şi economice trebuie să Ńină seama de forma obiectivă în care apar şi se
dezvoltă legăturile care urmează să fie studiate, precum şi de posibilitatea reflectării lor prin
expresii numerice adecvate.
Luând în considerare primul aspect - cunoaşterea formei obiective de manifestare a
legăturii -, aceasta se realizează printr-o analiză logică, bazată pe cunoştinŃele teoretice ale
disciplinelor de specialitate din domeniul respectiv şi verificată prin metode de calcul ş i
interpretare statistică.
În ceea ce priveşte cel de-al doilea aspect - posibilitatea reflectării legăturilor statistice
prin expresii numerice adecvate -, depinde de natura specifică a fenomenelor care intră în raport
de interdependenŃă şi de posibilitatea de măsurare a acestora, respectiv de natura informaŃiei de
care se dispune şi se poate folosi în măsurarea şi interpretarea acestor legături.

27
CONF. UNIV. DR. EMILIA GOGU STATISTICA

łinând seama de aceste două aspecte, la cercetarea legăturilor dintre fenomene se pot
folosi atât metode simple de interpretare a legăturii, cât şi metode analitice, bazate pe
interpretarea formei de dependenŃă.
în principal, metodele de analiză a corelaŃiei dintre fenomenele de masă se pot clasifica în
două grupe:
• metode şi procedee cu ajutorul cărora se pot constata existenŃa sau lipsa corelaŃiei; verifica
direcŃia în care se realizează şi permit o apreciere vizuală a tendinŃei de manifestare a
intensităŃii legăturii dintre fenomenele supuse corelaŃiei. Pentru aceasta, cel mai frecvent se
pot folosi: metoda seriilor statistice interdependente;
metoda grupărilor; metoda grafică; tabelul de corelaŃie; tabelul de asociere; metoda balanŃelor;
analiza dispersională;
• metode şi procedee analitice de calcul şi interpretare statistică prin care se măsoară existenŃa şi
direcŃia legăturii, precum şi forma şi gradul de intensitate în care se realizează. Aceste metode
şi procedee permit, deci, exprimarea raporturilor de interdependenŃă dintre fenomene, printr-
un sistem de indicatori de corelaŃie, printre care cei mai folosiŃi sunt ecuaŃiile de regresie,
coeficienŃii de corelaŃie simplă, parŃială şi multiplă, coeficienŃii de corelaŃie a rangurilor,
coeficienŃii de asociere.
Pentru interpretarea legăturilor dintre fenomene se pot folosi metode de sistematizare şi
verificare a legăturilor:
A. Metode parametrice simple şi analitice,
B. Metode neparametrice
A. METODE PARAMETRICE SIMPLE
Metodele de sistematizare şi verificare a corelaŃiei sunt:
a) seriile interdependente,
b) metoda tabelului de corelaŃie
c) metoda grupării,
d) metoda grafică,
e) metoda balanŃelor

5.3. Metode analitice (parametrice) de măsurare şi interpretare a


legăturilor statistice
În paragraful precedent au fost prezentate metodele de verificare a legăturilor dintre
fenomenele şi procesele economice de masă, ca momente iniŃiale ale cercetării statistice a
corelaŃiile dintre fenomene; cu ajutorul lor se face o sistematizare a informaŃiilor necesare
aplicării metodelor analitice de calcul şi interpretare statistică.
Aplicarea metodelor analitice trebuie să aibă în vedere, în primul rând, aspectele scoase în
evidenŃă în urma efectuării analizei calitative care trebuie să preceadă orice fel de cercetare
statistică, deci cunoaşterea conŃinutului social-economic al relaŃiilor de cauzalitate dintre
fenomene şi, în al doilea rând, să folosească cu discernământ concluziile formulate prin aplicarea
metodelor simple de corelaŃie, prin care s-au verificat existenŃa, direcŃia şi forma în care se
realizează legătura dintre fenomene.
În cazul în care nu se Ńine cont de aceste principii, calculul statistic devine un simplu
exerciŃiu formal pentru determinarea unor indicatori de corelaŃie nesemnificativi.
Pentru a evidenŃia legea care se manifestă în fiecare legătură în parte, pentru a măsura
statistic tendinŃa sa de manifestare se folosesc ecuaŃiile de estimare corespunzătoare unei funcŃii
analitice care exprimă forma de legătură dintre caracteristica factorială şi cea rezultativă. Această
funcŃie este cunoscută sub denumirea de funcŃie de regresie, iar reprezentarea ei grafică se face
prin linia (curba) de regresie. Alegerea corectă a funcŃiei de regresie, care să exprime cel mai
bine legătura dintre cele două caracteristici, este deosebit de importantă pentru determinarea
valorii statistice a indicatorilor de corelaŃie. Forma legăturii dintre cele două caracteristici se

28
CONF. UNIV. DR. EMILIA GOGU STATISTICA

calculează în funcŃie de modul de corelare a valorilor caracteristicii rezultative cu valorile


caracteristicii factoriale alese. Dacă funcŃia de regresie nu a fost aleasă în mod corespunzător,
atunci rezultatele analizei, respectiv valorile indicatorilor de corelaŃie, vor fi denaturate.
Pentru alegerea corectă a funcŃiei de regresie este necesar să se reprezinte legătura dintre
cele două serii de distribuŃie printr-un grafic de corelaŃie, care să permită interpretarea vizuală a
tendinŃei de asociere a celor două caracteristici perechi. Pe baza reprezentării grafice se poate
aprecia apoi dacă legătura este de formă rectilinie sau curbilinie. Tot ca instrument de verificare
a veridicităŃii funcŃiei de estimare, pentru măsurarea legături dintre cele două variabile în cadrul
colectivităŃii înregistrate, se pot folosi şi metodele de analiză dispersională, cu interpretarea
corespunzătoare rezultatelor în urma aplicării ei.
FuncŃia de regresie exprimă statistic modul în care caracteristica rezultativă (y) s-ar
modifica dacă ar varia numai valorile caracteristicii factoriale (x), iar ceilalŃi factori ar fi
consideraŃi cu acŃiune constantă în toate cazurile observate. Celelalte caracteristici, fiind
considerate ca neesenŃiale şi cu acŃiune constantă asupra tuturor unităŃilor la care se măsoară
raportul de interdependenŃă, înseamnă că influenŃa lor este sintetizată într-o singură valoare cu
caracter de medie. Legătura dintre cele două variabile se realizează tot sub formă de tendinŃă,
ceea ce înseamnă că pentru estimare se va folosi tot o ecuaŃie medie de tendinŃă corespunzătoare
formei identificate pe grafic.
Metoda analizei regresiei şi corelaŃiei s-a născut în legătură cu cercetările din biologie, s-a
dezvoltat pe baza experimentelor în genetică şi agrobiologie, extinzându-se apoi la alte domenii
ştiinŃifice, tehnice şi economice, cunoscând astăzi aplicaŃii m mai toate domeniile.
ApariŃia şi dezvoltarea acestei metode sunt legate în Anglia de numele lui Francis Galton
(1822-1911), biolog şi matematician, şi al lui Karl Pearson (1857-1936) matematician, biolog ş i
filosof. Primul coeficient de corelaŃie se pare că a fost formulat de matematicianul şi
statisticianul francez Auguste Bravaia (1811-1863).
Un promotor al dezvoltării metodelor statistice aplicate a fost revista „Biometrika",
înfiinŃată în 1901, unde s-au expus cele mai importante contribuŃii la teoria şi tehnica regresiei ş i
corelaŃiei.
Un rol important în dezvoltarea metodelor statistice 1-a avut celebra staŃiune Rothamsted,
unde au lucrat şi R.A. Fisher, M.G. Kendall şi alŃii.
Problema de la care au plecat Galton şi Pearson, în anii 1890, în analiza regresiei a fost din
domeniul eredităŃii. Galton a studiat corelaŃia dintre mărimea medie a părinŃilor şi mărimea
medie a copiilor, constatând o strânsă legătură care poate fi studiată cu ajutorul unei funcŃii
analitice. Constatând că, în timp, se manifestă o tendinŃă de scădere a înălŃimii descendenŃilor,
ecuaŃiile funcŃiei analitice cu care a măsurat această tendinŃă a numit-o ecuaŃie de regresie, iar
metoda de calcul şi analiză a corelaŃiei cu ajutorul funcŃiilor analitice de estimare, metoda
regresiei.
Această metodă a corelaŃiei din domeniul biologiei s-a extins şi în domeniul agrobiologiei
şi, mai târziu, şi în domeniul economic.
IniŃial, regresia şi corelaŃia erau legate numai de repartiŃia normală. Mai târziu s-au cercetat
şi fenomene care nu aveau o repartiŃie normală, dar erau corelate între ele. De asemenea, trebuie
menŃionat faptul că metoda corelaŃiei s-a aplicat avându-se în vedere două posibilităŃi în funcŃie
de volumul datelor de care se dispune: aplicarea în cazul unei colectivităŃi generale şi aplicarea
în cazul unui eşantion obŃinut cu ajutorul unor metode de sondaj, pentru corelaŃii simple ş i
multiple, liniare şi neliniare. În cel de-al
doilea caz, după cum s-a mai arătat, interpretarea se face cu ajutorul probabilităŃilor.

29
CONF. UNIV. DR. EMILIA GOGU STATISTICA

6. CAPITOLUL 6. ANALIZA STATISTICĂ A SERIILOR


CRONOLOGICĂ

Una din sarcinile statisticii este aceea de a studia fenomenele şi procesele social-
economice de masă de-a lungul diferitelor perioade de timp sub aspectul evoluŃiei
volumului acestora şi al schimbărilor intervenite în structura lor, a interdependenŃelor
dintre fenomene de natură diferită etc.
În analiza dezvoltării fenomenelor în timp, statistica foloseşte ca instrument
principal de cercetare indicatorii obŃinuŃi din prelucrarea statistică a seriilor cronologice.
Calculul acestor indicatori este precedat de elucidarea noŃiunii de "serie cronologică" şi
precizarea particularităŃilor acesteia.
Seria cronologică este formată din două şiruri de date paralele, în care primul îşi
arată variaŃia caracteristicii de timp, iar cel de-al doilea şir variaŃia fenomenului sau
caracteristicii cercetate, de la o unitate de timp la alta. Seriile cronologice se mai numesc
şi serii de timp sau serii ale dinamicii.
La analiza seriilor cronologice trebuie avut în vedere unele proprietăŃi ale acestora
şi anume:
- variabilitatea,
- omogenitatea,
- periodicitatea,
- interdependenŃa termenilor prezentaŃi.
Variabilitatea termenilor unei serii cronologice provine din faptul că fiecare
termen se obŃine prin centralizarea unor date individuale diferite ca nivel de dezvoltare.
Aceste diferenŃieri apar pe de o parte ca urmare a acŃiunii factorilor întâmplători şi pe de
altă parte ca urmare a faptului că în dinamică legile sociale şi economice se manifestă ca
tendinŃă imprimând fenomenelor forme diferite de variaŃie. Cu cât acŃiunea comună a
acestor factori este mai puternică cu atât variaŃia în cadrul seriei este mai mare şi
tendinŃele de scurtă şi lungă durată mai greu de sesizat.
Având în vedere această trăsătură, este necesar ca analizând o serie cronologică să
se măsoare atât gradul şi forma de influenŃă a factorilor esenŃiali, care imprimă
fenomenului o lege specifică de evoluŃie, cât şi gradul de abatere de la această tendinŃă
generală rezultată din influenŃa factorilor neesenŃiali, cu caracter întâmplător.
Omogenitatea termenilor trebuie înŃeleasă în sensul că în aceeaşi serie nu pot fi
înscrise decât fenomene de acelaşi gen, care sunt rezultatul acŃiunii aceloraşi cauze
esenŃiale. Asigurarea omogenităŃii observaŃiilor de-a lungul unei perioade de timp
presupune menŃinerea aceleiaşi metodologii de calcul şi evaluare a indicatorilor care
urmează să fie analizaŃi în dinamică a criteriilor de clasificare a colectivităŃii studiate şi
nomenclatoarelor şi lungimii intervalelor de grupare, menŃinerea unităŃii social-
economice sau administrativ teritoriale asupra căreia s-au făcut observaŃii, cât şi a unităŃii
de măsurare a timpului. Practic, înseamnă că de fiecare dată, când se analizează o serie
statistică trebuie să se verifice dacă datele provin din aceeaşi sursă, are acelaşi grad de
cuprindere a unităŃilor şi au fost folosite aceleaşi principii şi metode de prelucrare, cu alte
cuvinte este asigurată comparabilitatea datelor înscrise în aceeaşi serie.
O altă trăsătură caracteristică a seriilor cronologice o constituie periodicitatea
termenilor din care este formată seria, ceea ce înseamnă de fapt asigurarea continuităŃii
datelor din punct de vedere a variabilei de timp şi care poate da posibilitatea interpretării

30
CONF. UNIV. DR. EMILIA GOGU STATISTICA

seriei cronologice ca o funcŃie analitică (yi=f(ti)). Variabila de timp poate fi înregistrată


cu periodicităŃi diferite. De aceea, alegerea unităŃii de timp la care se referă datele unei
serii cronologice trebuie făcută în raport cu scopul cercetării, al conŃinutului şi
posibilităŃilor de măsurare a fiecărui indicator. De exemplu, producŃia industrială se poate
urmări atât în unităŃi de timp mici (ziua, decada, luna) cât şi în unităŃi mari de timp
(trimestrul, semestrul, anul).
În cazurile când unele caracteristici sunt influenŃate în variaŃia lor de schimbare a
anotimpurilor, cu alte cuvinte apar fenomene cu caracter sezonier (lunar sau trimestrial)
este obligatoriu să se folosească o astfel de periodizare a seriei.
În studiul seriilor cronologice, se pune problema atât a alegerii unităŃilor de timp
la care se referă fiecare indicator, cât şi a lungimii etapei pentru care se prezintă datele, cu
precizarea anului de bază. Ca an de bază se alege acel an care prezintă o anumită
semnificaŃie în evoluŃia fenomenului studiat.
InterdependenŃa termenilor unei serii cronologice apare ca urmare a respectării
principiului unităŃii de timp şi spaŃiu şi structurii organizatorice. Ca atare, indicatorii
prezenŃi sunt valori succesive ale aceloraşi fenomene înregistrate la nivelul aceleiaşi
unităŃi teritorial administrative sau orice unitate statistică complexă care poate fi
înregistrată autonom. Aceasta face ca valoarea fiecărui indicator să depindă într-o
oarecare măsură de valoarea indicatorului precedent, ca urmare a faptului că relaŃiile de
cauzalitate se manifestă în condiŃii asemănătoare de la o unitate de timp la alta.
Luând în considerare toate aceste particularităŃi, analiza statistică a seriilor
cronologice trebuie să se bazeze pe un sistem de indicatori, care să caracterizeze
multiplele relaŃii cantitative din interiorul seriei şi pe toată perioada la care se referă
datele. Ca atare, problemele care se pun şi trebuie rezolvate la analiza seriilor cronologice
sunt:
 alegerea lungimii seriei şi elaborarea ei astfel încât, pe cât posibil, să îndeplinească
condiŃia legii numerelor mari, adică să aibă un număr suficient de date pentru
orizontul de analiză statistică cu care să se fundamenteze corect prognozele de
lungă şi scurtă durată;
 calculul şi analiza unui sistem de indicatori statistici absoluŃi, relativi şi medii
necesari caracterizării seriei;
 identificarea trendului (tendinŃei) de evoluŃie a fenomenelor din cadrul seriei prin
utilizarea metodelor de ajustare statistică şi testelor de verificare a ipotezelor
privind forma obiectivă de evoluŃie pe perioada luată în calcul;
 calculul şi analiza sezonalităŃii şi a altor forme de evoluŃie cu caracter ciclic;
 interpolarea si extrapolarea seriilor cronologice potrivit scopului cercetării
statistice.
Aceste probleme se rezolvă diferit de la o serie la alta, în raport cu felul seriei,
lungimea ei şi tendinŃele de lungă şi scurtă durată ce pot fi identificate.
Astfel, în prezentarea dinamică a fenomenelor se pot întâlni mai multe feluri de
serii. Clasificarea seriilor cronologice se face în funcŃie de modul de exprimare a
indicatorilor şi după modul de exprimare a timpului la care se referă datele.
În funcŃie de modul de exprimare a indicatorilor din care este formată seria,
seriile cronologice pot fi:
- serii cronologice formate din indicatori absoluŃi;
- serii cronologice formate din indicatori relativi;
- serii cronologice formate din indicatori medii.

31
CONF. UNIV. DR. EMILIA GOGU STATISTICA

6.1. Seriile cronologice formate din indicatori absoluŃi


Reprezintă forma de bază a seriilor dinamice. Pe baza lor se pot obŃine indicatorii
generalizatori pe întreaga perioada.
Indicatorii de nivel sunt chiar termenii unei serii formate din indicatori absoluŃi
(y1, ...yt, ..., yn.).
 n 
Nivelul totalizat al termenilor  ∑ y t  , numai pentru seriile de intervale de timp
 t =1 
de mărimi absolute.
Modificările absolute
• cu bază fixă(∆t/1):
∆t/1=yt - y1 unde, t = 2, n
• cu bază în lanŃ (bază mobilă sau variabilă) (∆t/t-1):
∆t/t-1=yt - yt-1 unde, t = 2, n

6.2. Serii cronologice formate din indicatori relativi


Constituie un mod de prezentare de regulă procentual. În această situaŃie este
obligatoriu ca în titlu sau în afara tabelului să se specifice care este baza de raportare,
pentru ca interpretarea datelor să se facă corect.
Indice de dinamică
• cu bază fixă (It/1):
yt y
I t /1 = sau I t / 1(%) = t ⋅100 unde t = 2, n
y1 y1
• cu bază în lanŃ (It/t-1) :
yt y
I t / t −1 = sau I t / t −1(%) = t ⋅ 100 unde t = 2, n
yt −1 y t −1
Ritmul de dinamică
• cu bază fixă (Rt/1) :
yt − y1
Rt = ⋅ 100 sau Rt / 1 = I t / 1(%) −100% t = 2, n
1 y1
• cu bază în lanŃ (Rt/t-1) :
yt − yt −1
Rt / t −1 = ⋅100 sau Rt / t −1 = I t / t −1(%) − 100% t = 2, n
yt −1

6.3. Serii cronologice formate din indicatori medii


Se folosesc ca mijloc de prezentare a evoluŃiei unor caracteristici calitative ce apar
sub forma de categorii medii: productivitatea muncii, randamentul mediu, recolta medie
la ha, salariul mediu etc. De asemenea, se folosesc astfel de serii şi pentru unele
caracteristici cantitative atunci când ele trebuie incluse în analiza unor fenomene ce se
produc în cadrul unui interval de timp, ca de exemplu: valoarea medie anuală a fondurilor
fixe, numărul mediu al personalului muncitor.
Nivelului mediu

32
CONF. UNIV. DR. EMILIA GOGU STATISTICA

• pentru o serie cronologică de intervale de timp formate din indicatori absoluŃi:


n

∑y t
y= t =1

n
• pentru o serie de momente cu intervale egale între momente (media cronologică
simplă ):
y1 y
+ y 2 + y 3 + ... + y i +... + y n−1 + n
y cr = 2 2
n −1
• pentru o serie de momente cu intervale neegale între momente (media cronologică
ponderată):
d  d +d   d +d  d 
y1 1  + y2 1 2  +...yi  i −1 i  + ...+ yn n−1 
ycr =    2   2   2 
2
n−1

∑di i =1

Modificarea medie absolută:

∆=
∑ ∆ t / t −1 sau ∆ = yn − y1
n −1 n −1
Indicele mediu de dinamică ( I ) :
yn
I = n−1 ∏ I t / t −1 sau I = n −1
y1
Dacă dispunem de mai mulŃi indici medii ce caracterizează mai multe subperioade
succesive de timp, indicele mediu ce caracterizează întreaga perioadă se calculează astfel:
k

∑ ni
I = i =1
I 1n1 ⋅ I 2n2 ⋅ ... ⋅ I ini ⋅ ... I kn k
în care:
I - indicele mediu general de dinamică;
Ii - indicii medii parŃiali de dinamică;
ni - numărul indicilor cu bază în lanŃ ce intră în componenŃa fiecărui indice
mediu parŃial;
k - numărul subperioadelor, adică al indicilor medii parŃiali.
Ritmul mediu de dinamică
R = (I (%) ) − 100%

6.4. Serii cronologice de intervale (perioade) de timp

Denumite şi serii de fluxuri, sunt seriile statistice în care fiecare indicator


reprezintă rezultatul unui proces social-economic pe fiecare perioadă de timp folosită în
prezentarea datelor. Astfel de serii se pot întâlni în prezentarea evoluŃiei producŃiei, a
cifrei de afaceri, a mărimii investiŃiilor, a profitului realizat, a creditului acordat şi/sau
rambursat etc. Ele se întocmesc pentru indicatori însumabili pe o anumită perioadă de
timp, care determină periodicitatea cu care se prezintă termenii seriei. Termenii seriei de
intervale pot fi cumulaŃi obŃinându-se un indicator totalizator pe întreaga serie sau pe
subperioade.

33
CONF. UNIV. DR. EMILIA GOGU STATISTICA

Serii cronologice de momente (sau de stocuri)


Sunt acelea în care fiecare indicator caracterizează mărimea la care a ajuns
caracteristica urmărită sau volumul colectivităŃii în momentul de calcul. De exemplu,
puterea instalată, exprimată în mii Kw, la sfârşitul fiecărui an; populaŃia României, la 1
iulie a fiecărui an; valoarea capitalului fix al întreprinderii x la sfârşitul anului; valoarea
capitalului investit în industrie la sfârşitul fiecărui trimestru sau an; numărul
depunătorilor şi depozitelor la sfârşitul fiecărei luni etc.
Pentru seria de elemente este caracteristic faptul că termenii ei nu se pot cumula în
vederea obŃinerii unui indicator statistic totalizator cu conŃinut real pe întreaga perioadă,
deoarece seria de momente cuprinde înregistrări repetate. De exemplu, o parte din
mărfurile de la 1 I se pot găsi şi în stocurile de la 1 II, 1 III etc. Deci, aceşti termeni
reprezintă mărimi de stoc. Caracterizarea nivelului atins pe întreaga perioadă nu se poate
face, în acest caz, decât pe baza unui indicator mediu.
Scopul analizei datelor unei serii cronologice este acela de a caracteriza modul de
dezvoltare a fenomenelor sociale şi economice pe o perioadă expirată, în vederea
extrapolării datelor statistice pentru fundamentarea diferitelor calcule de prognoză.
Această analiză statistică se realizează în mod diferenŃiat în funcŃie de felul seriei (de
stocuri sau de fluxuri); de lungimea seriei şi de periodicitatea cu care este înregistrată
variabila de timp. Cea mai cuprinzătoare analiză statistică se realizează pentru seriile
cronologice, în care variaŃia de timp este continuă şi pe grafic se poate descrie sub forma
unei cronograme (historiograme) şi ca atare poate fi interpretată ca o funcŃie analitică de
timp.

6.5. Ajustarea seriilor cronologice


EvoluŃia oricărui fenomen în timp este rezultanta unor influenŃe de natură
sistematică şi a altora de tip aleator.
Componentele sistematice sunt:
• trendul (tendinŃa generală);
• sezonalitatea care se manifestă sub formă de oscilaŃii regulate la intervale mai
mici de un an (semestru, trimestru, lună, decadă);
• ciclicitatea care se prezintă sub formă de fluctuaŃii în jurul tendinŃei înregistrate la
perioade mai mari de un an.
Componentele aleatoare se manifestă sub forma unor abateri întâmplătoare de la
ceea ce are sistematic evoluŃia variabilei analizate.
Prin ajustarea termenilor unei serii de date statistice, se înŃelege operaŃia de
înlocuire a termenilor reali cu termeni teoretici ce exprimă legitatea specifică de
dezvoltare obiectivă a fenomenelor la care se referă datele.
Dispersia totală (σ2y ) se calculează după formula:
∑ (y − y)
2

σ =
2 i
y
n
( )
Dispersia termenilor seriei de la valorile ajustate σ y / r sintetizează influenŃa
2

factorilor reziduali - factori neînregistraŃi - (în cazul seriilor cronologice toŃi factorii cu
excepŃia factorului timp) şi se calculează cu formula:

34
CONF. UNIV. DR. EMILIA GOGU STATISTICA

∑ (y )
2
− Yti
σ =
2 i
y/r
n
în care Yti reprezintă valoarea teoretică a variabilei y în funcŃie de timp.
Dispersia valorilor ajustate de la valoarea medie σ y / t sintetizează variaŃia
2

produsă numai de modificarea factorului timp:


∑ (Y )
2
−y
σ =
2 ti
y/t
n
a. Metode simple de ajustare a seriilor cronologice
Metoda mediilor mobile
Se foloseşte pentru seriile care prezintă oscilaŃii sezoniere şi ciclice.
Mediile mobile sunt medii parŃiale, calculate dintr-un număr prestabilit de termeni,
în care se înlocuieşte pe rând primul termen cu termenul ce urmează în seria care trebuie
să fie ajustată.
În practică putem calcula medii mobile dintr-un număr impar de termeni sau dintr-
un număr par de termeni în funcŃie de periodicitatea influenŃei factorilor sezonieri.
Când ajustarea se face pe baza mediilor mobile calculate dintr-un număr par de
termeni, mediile mobile se obŃin în două trepte:
1. medii mobile provizorii ( yt ) care se plasează între termenii seriei;
2. medii mobile definitive sau centrate ( yt ) , care se plasează în dreptul termenilor seriei
şi cu care se face ajustarea termenilor seriei iniŃiale.
Metoda grafică
Acest procedeu presupune reprezentarea grafică a seriei de date empirice prin
cronogramă (historiogramă), urmată de trasarea vizuală a dreptei sau curbei, astfel încât
să aibă abateri minime faŃă de poziŃia valorilor reale în grafic.
Metoda modificării medii absolute
Ajustarea prin acest procedeu se foloseşte atunci când, prelucrând seria de date, se
obŃin modificări absolute cu bază în lanŃ apropiate ca valoare unele de altele, fără să
Ńinem sama de semnul lor.
FuncŃia de ajustare:
Yt = y1 + (t − 1) ∆ unde, t = 1, n
sau
Yti = y0 + t i ∆
unde,:
y0 reprezintă termenul luat ca bază de ajustare (acea valoare care se apropie cel
mai mult de dreapta sau curba trasată vizual în grafic);
ti reprezintă variabila de timp în raport cu baza de ajustare folosită (poziŃie pe
care termenul respectiv o are faŃă de termenul ales ca bază).
Metoda indicelui mediu de dinamică
Acest procedeu se foloseşte atunci când termenii seriei au tendinŃa de creştere de
forma unei progresii geometrice, în care raŃia poate fi considerată ca egală cu indicele
mediu de dinamică (I ) .
FuncŃia de ajustare:
Yt = y1 ⋅ I t −1
sau

35
CONF. UNIV. DR. EMILIA GOGU STATISTICA

Yti = y 0 ⋅ I ti
unde,:
y0 reprezintă termenul luat ca bază de ajustare;
ti reprezintă variabila de timp în raport cu baza de ajustare folosită (poziŃie pe
care termenul respectiv o are faŃă de termenul ales ca bază).
b. Metode analitice de ajustare
Metodele analitice au la bază un model matematic, în care tendinŃa centrală a
evoluŃiei se exprimă ca o funcŃie de timp:
yi = f(ti) numită funcŃie de ajustare,
în care:
ti - reprezintă valorile variabilei independente (timpul);
yi - reprezintă valorile variabilei dependente (fenomenele) care sunt prezentate în
seria cronologică.
Alegerea tipului de funcŃie care se potriveşte cel mai bine pentru exprimarea
trendului se face pe baza următoarelor criterii aplicabile opŃional:
 criteriul bazat pe reprezentarea grafică. Se construieşte cronograma şi se
apreciază forma tendinŃei de evoluŃie;
 criteriul diferenŃelor. Se procedează la calculul diferenŃelor absolute cu
bază în lanŃ de ordinul unu, doi etc. până când obŃinem diferenŃele de ordin
i aproximativ constante, ajustarea făcându-se după polinomul de gradul i.
Dacă fenomenul cercetat s-a dezvoltat în progresie geometrică, adică indicii cu
bază în lanŃ sunt constanŃi (It/t-1 = constant), admitem că seria cronologică respectivă
prezintă o tendinŃă exponenŃială.
În urma alegerii funcŃiei de ajustare după criteriile prezentate se impune estimarea
parametrilor acestor funcŃii utilizând metoda celor mai mici pătrate. Această metodă are
ca funcŃie obiectiv minimizarea sumei pătratelor abaterilor valorilor reale de la cele
ajustate deci:
min ∑ ( y i − Yt ) ti= 1, 2, ... ,n timpul
2
i

Trend liniar
Yti = a + b ti
în care:
Yti - reprezintă valorile ajustate calculate în funcŃie de valorile caracteristicii
factoriale (ti);
a - reprezintă parametrul care are sens de mărime medie şi arată ce nivel ar fi
atins y dacă influenŃa tuturor factorilor cu excepŃia celui înregistrat, ar fi fost constantă pe
toată perioada;
b - reprezintă parametrul care sintetizează numai influenŃa caracteristicii
factoriale (t):
ti - reprezintă valorile caracteristicii factoriale care, în cazul seriilor cronologice,
este timpul.
Parametrii a şi b se determină prin rezolvarea sistemului de ecuaŃii normale
obŃinut prin metoda celor mai mici pătrate ( ∑ [ y i − (a + bt i )]2 = min ):
 na + b ∑ t i = ∑ y i

 a ∑ t i + b ∑ t i = ∑ t i y i
2

36
CONF. UNIV. DR. EMILIA GOGU STATISTICA

Pentru ∑t i =0, sistemul de ecuaŃii normale devine:



a =
∑ yi
na = ∑ y i  n
 de unde, 
b∑ t i = ∑ t i y i b = ∑ t i y i
2


 ∑ ti2
VariaŃia de timp trebuie centrată şi pentru seriile impare se măsoară în unităŃi iar
pentru cele pare în jumătăŃi de interval între termenii seriei
Înlocuind valorile calculate ale celor doi parametri în ecuaŃia de regresie şi apoi
înlocuind succesiv valorile variabilei timp se obŃin valorile ajustate ale caracteristicii
rezultative.

6.6. Extrapolarea seriilor cronologice

Extrapolarea datelor unei serii statistice are la bază metodele şi procedeele folosite
la ajustare.
Pentru a face distincŃie între termenii ajustaŃi (Yti) şi cei extrapolaŃi - care sunt
consideraŃi tot termenii teoretici - se vor nota termenii extrapolaŃi cu Yt′i , iar variabila de
timp cu ti’.
Deci, formulele de calcul vor fi:
• pentru extrapolarea pe baza sporului mediu:
Yt′i = y 0 + t i' ∆
• pentru extrapolarea pe baza indicelui mediu de creştere:
Yti′ = y 0 ⋅ I ± ti
'

Aceste formule se aplică atunci când se folosesc valorile parametrilor (∆, I ) din
perioada expirată. În cazul când aceştia se modifică, formulele se modifică cu un
coeficient K, astfel:
Yt′ = y 0 + t i' ∆ ′
i
în care: ∆' = k ⋅ ∆
Yt′ = y 0 ⋅ I ′ ± t ′
în care: I′ = k I
Coeficientul k poate să fie mai mare sau mai mic decât 1.
Dacă k<1, atunci înseamnă că se reduce variaŃia medie absolută sau relativă, după
cum se aplică la primul sau la al doilea procedeu.
Dacă k>1, atunci înseamnă că valoarea parametrilor folosiŃi în extrapolare este
mai mare decât în perioada de analizat.
Pentru extrapolarea pe baza metodelor analitice de calcul se pune, în primul rând,
condiŃia ca datele să se determine astfel încât să nu modifice originea variaŃiei de timp
care este în mijlocul seriei cronologice şi pentru care Σti = 0. Deci, variaŃia de timp se
extinde în ambele sensuri, deşi interesează numai tendinŃa obŃinută prin extinderea seriei
pentru perioada următoare.

37

S-ar putea să vă placă și