Tema 2. Observarea Si Prelucrarea Datelor Statistice
Tema 2. Observarea Si Prelucrarea Datelor Statistice
Tema 2. Observarea Si Prelucrarea Datelor Statistice
STATISTICA
anterioare, de regul, laborioase i ndelungate. Comparnd rezultatele prelucrrii i verificnd ipotezele, se pot formula n final concluzii i explicaii asupra obiectului cercetrii. Totodat, se fundamenteaz calculele de prognoz privind fenomenul analizat. Dei separate n timp i spaiu, cele trei etape ale cercetrii statistice sunt legate logic prin obiectul cercetrii. Observarea trebuie s furnizeze un volum suficient de date de calitate corespunztoare, care s asigure coninut real indicatorilor obinui n etapa prelucrrii. Alegerea celor mai potrivite metode de prelucrare i utilizarea lor n funcie de particularitile domeniului respectiv permit calcularea unor indicatori care surprind esena fenomenului investigat. Corectitudinea concluziilor finale se bazeaz pe autenticitatea datelor i precizia prelucrrii. 2.2 PROIECTAREA OBSERVRII STATISTICE Observarea este prima faz a cercetrii statistice i const n nregistrarea, dup criterii unitare, a datelor individuale cu privire la fenomenul studiat. Reuita acestei etape depinde de nregistrarea corect a unui volum suficient de date relevante pentru studiul respectiv. Culegerea datelor trebuie s se realizeze la nivelul fiecrei uniti a colectivitii. Pentru a asigura buna desfurare a acestei activiti, observarea statistic trebuie organizat dup un program care cuprinde o serie de elemente metodologice i organizatorice. a) Stabilirea scopului observrii, care precizeaz aspectele ce trebuie clarificate n urma studiului. Scopul observrii este subordonat scopului general al cercetrii statistice i formularea sa exact orienteaz ntregul demers statistic, care este format dintr-o succesiune de operaiuni intercondiionate. Din aceast perspectiv vor fi selectate doar informaiile cu adevrat necesare, care vor fi supuse prelucrrilor ulterioare. b) Obiectul observrii este reprezentat de colectivitatea statistic despre care urmeaz s se culeag date. Aceasta coincide cu colectivitatea statistic general, n cazul observrilor totale, sau este o subcolectivitate a acesteia, n cazul observrilor pariale. Colectivitatea supus observrii trebuie definit i delimitat n timp i spaiu. Colectivitile complexe i de volum mare pot fi observate pe subcolectiviti.
c) Unitile de observare sunt componentele individuale distincte ale colectivitii generale. Unitile de observare pot fi simple sau complexe, statice sau dinamice. Definirea lor clar i concis asigur nregistrarea corect a datelor. d) Timpul observrii este momentul sau perioada producerii fenomenului analizat. Pentru observrile statice este un "moment critic", care este bine s corespund unei maxime stabiliti a colectivitii analizate. Pentru nregistrrile dinamice, timpul observrii reprezint o perioad de timp. e) Momentul n care se face nregistrarea datelor este ulterior timpului observrii, dar poate s coincid cu acesta dac nregistrarea se face odat cu producerea fenomenului. n prelucrarea datelor se reine numai timpul observrii. f) Caracteristicile observrii sunt acele trsturi, proprieti eseniale ale colectivitii care au fost selectate pentru a fi nregistrate n formulare. Este important s fie nregistrate caracteristicile relevante din punctul de vedere al scopului cercetrii. Deseori, caracteristicile se trec n programul observrii sub form de ntrebri. Acestea pot fi cu rspunsuri deschise (se admite orice variant de rspuns) sau nchise (rspunsuri listate). g) Formularele observrii, nsoite de instruciuni de completare, asigur culegerea datelor ntr-o form unitar, sistematizat, facilitnd prelucrrile ulterioare. h) Locul observrii este de regul chiar locul producerii fenomenului. Difer de acesta atunci cnd datele sunt preluate din diferite publicaii, din evidene contabile etc. Buna desfurare a observrii impune i rezolvarea unor probleme organizatorice cum sunt: elaborarea listei unitilor care vor fi supuse observrii, instruirea persoanelor care vor efectua nregistrarea datelor, tiprirea i difuzarea formularelor, operaiuni de ndrumare i control, popularizarea operaiunilor etc.
STATISTICA
2.3 METODE DE OBSERVARE STATISTIC Observarea se poate realiza prin nregistrarea direct a datelor sau indirect, fie prin interogare (pe baz de chestionar), fie prin preluarea datelor deja existente n documente contabile. Observarea poate fi total, dac se includ toate unitile colectivitii statistice (este cazul recensmntului i al raportrilor statistice) sau parial, atunci cnd datele se nregistreaz doar pentru un numr mai redus de uniti statistice (sondaj). Observarea poate fi curent, dac datele se nregistreaz permanent, pe msur ce se produc evenimentele vizate, periodic, atunci cnd survine la anumite intervale de timp bine stabilite, i special organizat, dac se efectueaz la intervale mari, neregulate, de timp. n practica statistic, metodele de observare folosite frecvent sunt: rapoartele statistice; cercetarea selectiv (sondajul); recensmntul; ancheta statistic; observarea prii principale; monografia. Rapoartele statistice sunt documente oficiale, tipizate, prin care se obin date referitoare la activitatea curent a unitilor economice. Ele cuprind informaii privind cifra de afaceri, profit, capital fix, for de munc, costuri de producie etc. Agenii economici sunt obligai s ntocmeasc rapoartele statistice n forma analitic stabilit, folosind o metodologie unitar de calcul al indicatorilor. Numrul i coninutul rapoartelor statistice difer de la un domeniu de activitate la altul. Reprezint observri totale (sunt completate de toate unitile economicosociale) i permanente (se completeaz n tot timpul anului, la termene fixe). Sistemul raportrilor statistice tinde s se restrng n prezent, n favoarea sondajului statistic. Sondajul statistic reprezint o nregistrare parial, selectiv, care se aplic atunci cnd observarea total fie nu este posibil (de ex., la controlul calitii produselor), fie nu este justificat economic (din cauza costurilor sau a duratei). Sondajul statistic presupune culegerea efectiv a datelor doar pentru o parte a colectivitii totale (eantion) aleas astfel
nct s fie reprezentativ fa de colectivitatea de ansamblu, s prezinte aceleai trsturi eseniale. Dei implic o marj de eroare, procedeul este larg rspndit n rile cu economie de pia, unde exist instituii specializate n sondaj. Recensmntul este o observare total, special organizat la intervale mari de timp (5-10 ani). Cea mai veche i mai rspndit form a sa o reprezint studiul populaiei; ulterior procedeul a fost folosit i pentru industrie (de ex., recensmntul capitalului fix), agricultur (recensmntul animalelor), comer, alte domenii de activitate. Este un tip de observare static, care se efectueaz simultan la toate unitile colectivitii, consemnnd situaia existent la un moment dat. Pentru a avea o imagine a dinamicii fenomenelor i proceselor economice este necesar compararea datelor provenite de la mai multe recensminte. n acest scop trebuie s se asigure metodologii unitare de nregistrare i este necesar s fie respectate recomandrile organismelor statistice internaionale. Costul ridicat al recensmntului, perioada ndelungat de pregtire necesar i dificultile organizatorice explic tendina de cretere a intervalului de timp de la un recensmnt la altul. n etapele intermediare, sondajul statistic asigur reactualizarea datelor. Ancheta statistic const n culegerea datelor pe baza unor chestionare. La fel ca sondajul statistic, este o observare parial, dar, bazndu-se pe o completare benevol a chestionarelor, nu asigur reprezentativitatea. Este o observare special organizat, de regul cu ocazia unor trguri i expoziii, avnd o valoare orientativ privind tendina general a fenomenelor. Observarea prii principale este o metod care se poate utiliza cu succes n colectivitile inegal structurate pe grupe, care prezint predominana uneia sau mai multor grupe. Observarea se limiteaz la aceast parte cu rol decisiv. Dei mai puin riguroas, rapiditatea metodei o recomand atunci cnd este suficient o informare orientativ asupra colectivitii generale. De exemplu, estimarea preliminat a produciei industriale se poate baza doar pe rezultatele obinute de ntreprinderile semnificative din ramur. Monografia asigur o caracterizare multilateral a unor uniti statistice complexe. Programul observrii este foarte amnunit, permind o cunoatere aprofundat a fenomenului analizat. De regul,
STATISTICA
obiectul unei monografii l constituie un ora sau o regiune, o unitate sau o problem economic.
2.4 ERORILE DE OBSERVARE I CONTROLUL DATELOR Eroarea, inerent oricrei activiti umane, survine i n procesul nregistrrii datelor observrii, ndeosebi atunci cnd colectivitatea statistic este de dimensiuni mari i sistemul de caracteristici diversificat. n funcie de cauza care le produce i dup gravitatea lor, erorile au fost grupate n dou categorii: sistematice i ntmpltoare. 1. Erorile sistematice au o inciden redus, dar afecteaz ntr-o msur nsemnat autenticitatea datelor culese. Ele provin, de regul, din interpretarea incorect a instruciunilor de culegere a datelor, nenelegerea scopului observrii sau necunoaterea unor noiuni; acestea conduc la nscrierea repetat n formularele observrii a unor informaii neconforme cu realitatea. Amploarea erorilor sistematice este direct proporional cu volumul colectivitii observate. Erorile sistematice pot fi prevenite printr-o mai bun instruire a personalului care efectueaz observarea i pot fi diminuate prin aplicarea riguroas a controlului aritmetic i logic. 2. Erorile ntmpltoare au caracter aleator i survin, de regul, datorit lipsei de concentrare a persoanei care efectueaz nregistrarea, copierea sau codificarea datelor. Dei apare relativ frecvent, acest tip de eroare influeneaz doar n mic msur acurateea rezultatelor de ansamblu; explicaia acestui efect redus este dat de faptul c erorile ntmpltoare se manifest sub forma unor abateri (att pozitive, ct i negative) de la valorile reale, compensndu-se pentru colectiviti de dimensiuni mari. Operaiunile de control al datelor urmresc depistarea i nlturarea eventualelor erori. Controlul vizeaz aspectul cantitativ i pe cel calitativ. Controlul cantitativ se refer la completitudinea datelor. Se urmrete dac s-au strns formularele de la toate unitile supuse observrii i se verific dac au fost completate toate rubricile din formulare.
Controlul calitativ vizeaz verificarea relaiilor cantitative existente ntre mrimile economice, a marjei de valori admisibile pentru anumii indicatori i concordana ntre valorile acelor fenomene ntre care exist legturi de interdependen. 2.5 PRELUCRAREA PRIMAR A DATELOR STATISTICE Datele statistice obinute n timpul observrii sunt, de regul, variate i de volum mare. Ele trebuie sistematizate, centralizate i grupate pentru a fi pregtite n vederea prelucrrii. Numai n urma prelucrrii statistice pot fi evideniate trsturile i tendinele eseniale din evoluia fenomenelor i proceselor economico-sociale. Prelucrarea primar a datelor statistice culese cuprinde operaiile de clasificare, grupare, centralizare, agregare, calcul de caracteristici derivate, precum i construirea de tabele, serii i grafice statistice. Prima faz a prelucrrii primare o reprezint sistematizarea datelor sub form matriceal (tabelul 2.5.1), astfel: - pe fiecare linie sunt evideniate variantele tuturor caracteristicilor nregistrate (X1, , Xj, , Xm) referitoare la o unitate statistic (Ui) a colectivitii supuse observrii: xi1, , xij, , xim; - fiecare coloan surprinde variantele unei anumite caracteristici Xj, nregistrate pentru toate unitile (U1, , Ui, , Un) colectivitii statistice: x1j, , xij, xnj. Elementele matricei pot lua valori pozitive sau negative; de asemenea, se pot ntlni valori nule.
Tabelul 2.5.1 Uniti statistice Caracteristici statistice
U1 Uj Un
STATISTICA
Datele primare sunt prelucrate n continuare, obinndu-se caracteristici derivate. Calcularea mrimilor derivate se realizeaz prin operaiuni diferite: ca produs ntre dou caracteristici primare (de exemplu, valoarea produciei calculat ca produs ntre pre i producia fizic); ca sum sau diferen ntre dou sau mai multe caracteristici primare (de exemplu, formarea brut de capital fix plus variaia stocurilor d formarea brut de capital, iar produsul naional brut minus amortizarea d produsul naional net); ca raport ntre dou caracteristici primare (mrimile relative). Datele statistice difer ntre ele i n funcie de modul de msurare. n teoria statistic au fost evideniate mai multe procedee de msurare a datelor: a) Scala nominal se refer la caracteristicile cu form calitativ exprimat prin cuvinte (de exemplu: meserii, stare civil, ramuri i subramuri ale economiei naionale, domenii de activitate etc.). Pentru aceste caracteristici se poate atribui o valoare numeric fiecrei variante, cu sensul de codificare (de exemplu: codificarea ramurilor economiei naionale, codificarea activitilor economice sau codificarea strii civile n cadrul codului numeric personal din buletinul de identitate). Nu sunt posibile operaii matematice cu aceste valori numerice asociate variantelor. b) Scala ordinal se utilizeaz tot pentru caracteristici necuantificabile, dar care permit ierarhizarea variantelor. Aceste caracteristici sunt ordonate cresctor sau descresctor, acordndu-i-se fiecreia un numr (rang) care reflect poziia sa n ir. Exemple: clasele de calitate ale produselor, calificativele acordate elevilor din ciclul primar (nesatisfctor, satisfctor, bine i foarte bine), numrul de stele atribuite unitilor de alimentaie public i hoteliere (de la 1 la 5 stele). Rangurile pot fi folosite n unele modele de calcul statistic, respectndu-se anumite restricii. c) Scala de interval este folosit pentru caracteristici numerice crora le corespund anumite valori, n funcie de intervalul
dintre variante. Originea scalei i unitatea de msur se aleg arbitrar. Admisibile pentru acest tip de caracteristici sunt numai operaii de diferen ntre valori, precum i calcule cu aceste diferene. Exemple: timpul calendaristic, temperatura etc. d) Scala de raport, ca i cea de interval, este folosit pentru caracteristici numerice. Dou valori msurate prin intermediul acestei scale se afl n acelai raport, indiferent de unitatea de msur utilizat (de exemplu raportul salariilor pentru doi angajai ntre care se face comparaie este acelai indiferent de moneda folosit) . Pentru acest tip de caracteristici sunt permise toate operaiile matematice. Punctul zero al scalei este dat n mod natural. Unitatea de msur se alege arbitrar (de exemplu, cifra de afaceri se poate exprima n mii, milioane sau miliarde de lei, n moned naional sau n diferite valute) . Operaiile de prelucrare primar sunt permanent nsoite de analiza datelor statistice, n scopul identificrii trsturilor definitorii ale datelor primare, al orientrii procesului de prelucrare statistic, al alegerii celor mai potrivite metode i tehnici statistice. Caracterul ei cuprinztor, varietatea aspectelor implicate i multitudinea cunotinelor tiinifice i practice solicitate n acest proces justific denumirea sa de analiz multidimensional. Prima faz a acestei analize este reprezentat de ordonarea, cresctoare sau descresctoare, a valorilor distincte ale caracteristicii. Aceste valori sunt nsoite, n cazul seriilor de frecvene, de mrimi care arat numrul de apariii al fiecrei variante a caracteristicii. Urmtoarea faz const n clasificarea i/sau gruparea datelor statistice, operaii care permit ordonarea materialului statistic. 2.6 CLASIFICAREA I GRUPAREA DATELOR STATISTICE Pornind de la trsturile comune ale unitilor colectivitii observate, acestea sunt repartizate n clase bine definite, cu caracter omogen. Aceast operaie permite restrngerea volumului mare de date iniiale i evideniaz structura colectivitii analizate. Prin grupare se pierde o parte din informaia iniial, n schimb se nlesnete cunoaterea proprietilor
STATISTICA
eseniale ale colectivitii i nelegerea legturilor dintre caracteristicile utilizate. Prin clasificare i grupare, datele observrii sunt sistematizate n funcie de variaia uneia sau mai multor caracteristici. Clasificarea trebuie s respecte mai multe reguli: a) completitudinea se refer la cerina ca toate unitile statistice s fie incluse n clasele formate n urma clasificrii; b) omogenitatea reprezint condiia de a include ntr-o clas numai elemente de acelai tip; c) unicitatea clasificrii impune ca fiecare element s aparin unei singure clase; d) continuitatea variaiei cere s nu existe clase cu frecven nul n cazul variabilelor cu variaie continu. Exist mai multe tipuri de clasificri: a) clasificare ierarhic, pe dou sau mai multe niveluri de agregare; b) repartizarea unitilor colectivitii ntr-un numr prestabilit de clase; c) clasificare geometric. Statistica naional utilizeaz un sistem standardizat de clasificri i nomenclatoare economico-sociale. Acesta cuprinde: clasificarea ramurilor economiei naionale: agricultur, industrie, construcii, comer etc.; clasificarea unitar a produselor i serviciilor; clasificarea ocupaiilor: profesii, funcii, meserii; clasificarea mijloacelor fixe; nomenclatorul unitar al indicatorilor economico-sociali; sistemul informatic registru al unitilor teritorialadministrative. Gruparea datelor statistice const n mprirea unitilor colectivitii n ansambluri omogene, bine definite, dup variaia uneia sau mai multor caracteristici (numite factori de grupare). O grup omogen este format din ansamblul unitilor statistice care prezint cel puin o proprietate comun. Omogenitatea grupelor este asigurat i de o variaie redus a valorilor individuale n cadrul fiecrei grupe. Pentru a asigura o grupare corect i semnificativ se impune selecionarea caracteristicilor eseniale, cu caracter stabil. Alegerea
caracteristicilor difer n funcie de scopul analizei. De exemplu, dac se analizeaz productivitatea muncitorilor dintr-o secie, vom urmri vechimea, calificarea, vrsta, dotarea tehnic etc., iar dac se studiaz potenialul unei uniti economice, vom alege caracteristicile cifr de afaceri, profit, numr de personal, capital fix etc. Exist numeroase tipuri de grupri statistice, difereniate dup mai multe criterii. 1. n funcie de numrul caracteristicilor utilizate, gruprile pot fi simple sau combinate. Gruprile simple sunt cele realizate dup o singur caracteristic de grupare. De exemplu: gruparea salariailor dup venitul realizat sau gruparea judeelor dup numrul populaiei. Gruprile combinate vizeaz simultan dou sau mai multe caracteristici de grupare, simultan (tabelul 2.6.1). Gruparea se realizeaz etapizat: se alege o prim caracteristic dup care se efectueaz gruparea unitilor colectivitii i fiecare grup astfel obinut se mparte la rndul ei n subgrupe dup variaia celei de a doua caracteristici, apoi se repet procedeul pentru cea de a treia caracteristic de grupare .a.m.d.
Gruparea combinat dup dou caracteristici de grupare
Tabelul 2.6.1
Caracteristica X Caracteristica Y Frecvene combinate
x1
Total grupa 1
xi
ni1 ni2
STATISTICA
Caracteristica X
Caracteristica Y
Frecvene combinate
Total grupa i
nij nim
ni.= nij
j=1 m
xk
n
i=1 j=1
ij
= ni . = n
i =1
Deoarece o frmiare excesiv a colectivitii ar anula semnificaia gruprii i ar face imposibil analiza, n practic se utilizeaz maximum trei caracteristici pentru gruparea combinat. De exemplu, gruparea populaiei dup vrst, stare civil i sex. 2. Dup coninutul caracteristicii de grupare deosebim grupri cronologice, teritoriale i atributive. Gruprile cronologice se refer la variaia n timp a fenomenului analizat. n funcie de scopul analizei, mrimea intervalului de timp utilizat n grupare difer: zi, lun, trimestru, an etc. De exemplu: producia zilnic realizat de muncitorii dintr-o secie, cheltuieli lunare de producie, profitul anual. Gruprile teritoriale oglindesc variaia n spaiu a unitilor colectivitii. De regul, aceste grupri corespund unitilor teritorial-ad-ministrative. Exemple: gruparea produciei agricole pe judee, desfaceri cu amnuntul pe principalele orae ale rii, relaii de import/export pe zone geografice i ri.
Gruparea dup o caracteristic atributiv prezint dou variante: - caracteristic exprimat prin cuvinte: gruparea produciei pe ramuri economice, gruparea salariailor unei uniti economice pe meserii etc. - caracteristic exprimat numeric: gruparea societilor comerciale dup cifra de afaceri, gruparea familiilor dup numrul de copii etc.
3. Dup modul de variaie a caracteristicii, gruparea se poate face pe variante, pe intervale egale de variaie sau pe intervale inegale de variaie. Gruparea pe variante presupune stabilirea unei grupe pentru fiecare valoare luat de caracteristica de grupare. Acest lucru este posibil atunci cnd numrul variantelor este redus. De exemplu: gruparea apartamentelor dup numrul de camere, gruparea populaiei dup starea civil, gruparea salariailor dup sex, gruparea studenilor dup tipul liceului absolvit etc. Gruparea pe intervale de variaie se utilizeaz n cazul caracteristicilor numerice care nregistreaz un numr mare de valori individuale diferite. Pentru a facilita analiza statistic, aceste valori sunt restrnse, sistematizate ntr-un numr redus de grupe. Fiecare grup astfel constituit include unitile colectivitii pentru care valoarea caracteristicii se ncadreaz ntr-un anumit interval de valori. Aceste intervale de variaie pot fi de mrimi egale (de exemplu, gruparea dup vrst pe intervale de cte cinci ani, gruparea seciilor dup producie pe intervale de cte 10 milioane lei etc.) sau nu. Gruparea n intervale de mrimi inegale este justificat numai atunci cnd repartiia valorilor individuale n cadrul colectivitii este neuniform sau atunci cnd o parte a colectivitii statistice prezint un interes deosebit, fiind necesar o analiz mai detaliat a acesteia. Gruparea pe intervale neegale permite evidenierea tipurilor calitative care se contureaz n cadrul colectivitii.
STATISTICA
O importan deosebit o are problema alegerii mrimii intervalului de grupare i stabilirea numrului de grupe. Alegerea numrului de grupe trebuie s evite dou erori frecvente: stabilirea unui numr prea mare de grupe, ceea ce conduce la frmiarea colectivitii, cu consecine negative att pe planul identificrii trsturilor eseniale ale fenomenului analizat, ct i pe planul calculelor statistice ulterioare, care devin mai laborioase; stabilirea unui numr prea mic de grupe prezint pericolul estomprii deosebirilor calitative din cadrul structurii colectivitii, alternd concluziile analizei. Aadar, alegerea numrului de grupe este o decizie dificil care implic experiena i talentul statisticianului. Acesta trebuie s aib n vedere natura caracteristicii, amplitudinea variaiei valorilor nregistrate, scopul analizei statistice etc. Fiecare interval de grupare trebuie s cuprind un numr suficient de mare de valori individuale. Gruparea pe intervale egale presupune urmtoarele operaiuni: stabilirea caracteristicii de grupare; calcularea amplitudinii variaiei; stabilirea mrimii intervalului de grupare; precizarea limitelor superioare i inferioare ale intervalelor de grupare; determinarea numrului unitilor statistice care sunt incluse n fiecare interval. Amplitudinea variaiei (A) se stabilete ca diferen ntre valoarea maxim (xmax) i valoarea minim (xmin) nregistrat de caracteristica respectiv: A = xmax - xmin Mrimea intervalului de grupare (h) se determin pe baza raportului dintre amplitudinea variaiei (A) i numrul de grupe (h) ales:
h=
A x max x min = k k
Atunci cnd ctul mpririi nu este un numr ntreg se rotunjete n plus pentru a nu rmne valori n afara ultimului interval de grupare. Pentru determinarea mrimii intervalului de grupare se poate utiliza i formula lui Sturges, recomandat n literatura de specialitate pentru colectivitile de dimensiuni relativ mari, urmrind o distribuie apropiat de cea normal. Astfel: x max x min h= 1 + 3,322 lg n unde: n - numrul unitilor statistice din colectivitatea analizat.
Intervalele de grupare se definesc prin precizarea limitei inferioare i superioare. Determinarea primului interval de grupare pornete de la valoarea minim a caracteristicii (limita inferioar) la care se adaug mrimea intervalului de grupare, obinndu-se limita superioar. n cazul caracteristicilor cu variaie continu, limita superioar a primului interval devine limita inferioar a celui de-al doilea interval. Limita superioar a intervalului al doilea se obine adugnd mrimea intervalului la limita inferioar. Limita superioar a intervalului al doilea devine limita inferioar pentru al treilea interval i procedeul continu pn cnd se precizeaz limitele tuturor celor k intervale (vezi tabelul 2.6.2, prima coloan). ntruct gruparea are variaie continu, este necesar s se precizeze care din cele dou limite (inferioar sau superioar) este inclus n interval. n acest fel ne asigurm c o valoare situat la grania dintre dou intervale va fi inclus ntr-un singur interval, respectndu-se unicitatea gruprii. n cazul caracteristicilor cu variaie discret, limita superioar a unui interval se difereniaz de limita inferioar a intervalului urmtor (tabelul 2.6.2, coloana a treia).
STATISTICA
Tabelul 2.6.2
Grupare continu
1 2
Grupare discret
3 4
Intervale
Nr. uniti
f1 f2 fi fi+1 fk
i =1
fi
Intervale
Nr. uniti
n1 n2 ni ni+1 nk
n
i =1
n practica statistic se ntlnesc deseori situaii n care valorile extreme ale caracteristicii (xmin i xmax) sunt foarte ndeprtate de restul valorilor. n acest caz valorile extreme pot fi omise, iar primul i ultimul interval devin intervale deschise (nu este precizat limita inferioar a primului interval i nici limita superioar a ultimului interval). Atunci cnd prelucrrile ulterioare o impun, aceste intervale pot fi nchise, fiind considerate de lungime egal cu intervalele vecine. Lungimea fiecrui interval este dat de diferena dintre cele dou limite. Se recomand ca limitele de interval s se exprime prin numere ntregi.
Gruparea pe intervale neegale este preferabil n cazul colectivitilor de dimensiuni mari, cu structur neomogen i cu o amplitudine a variaiei foarte mare. O bun grupare pe intervale neegale depinde de acurateea analizei calitative asupra structurii i particularitilor colectivitii. Gruparea tipologic este o grupare pe intervale neegale care pune n eviden tipurile calitative reprezentative pentru colectivitatea analizat. Aceast operaiune poate fi precedat de o grupare pe mai multe intervale egale. Intervalele egale sunt reunite apoi pe baza unui anumit
criteriu. De exemplu, folosind criteriul mediei, vom defini tipul "mediu" unind intervalul n care se afl media cu cele dou intervale alturate. n cele ce urmeaz, vom ilustra modalitile de grupare a datelor pe intervale egale i neegale folosind urmtoarele mrimi ale produciei realizate (numr buci) ntr-o lun de ctre cei 65 de muncitori ai unei uniti industriale: 61, 66, 56, 71, 73, 67, 76, 69, 66, 77, 81, 69, 58, 50, 59, 74, 64, 71, 76, 63, 51, 73, 61, 64, 67, 64, 66, 69, 63, 72, 78, 82, 67, 57, 71, 83, 61, 73, 64, 58, 68, 62, 67, 63, 67, 69, 61, 79, 62, 68, 63, 67, 62, 68, 69, 66, 58, 72, 78, 67, 84, 66, 59, 73, 66.
Gruparea pe intervale egale Producia cea mai mic realizat n ntreprindere a fost de 50 de buci, iar cea mai mare de 84 de buci. Amplitudinea variaiei (A) este:
Avnd n vedere amplitudinea variaiei i volumul colectivitii, am stabilit un numr de 7 grupe. mprind amplitudinea variaiei la numrul de grupe ales (k), determinm mrimea intervalelor egale de variaie (h):
h=
A 34 = = 4 ,857 5 buci k 7
Natura datelor ne indic s folosim intervale de variaie discrete. Limitele intervalelor de grupare i numrul muncitorilor din fiecare grup (frecvenele absolute) sunt prezentate n tabelul 2.6.3.
STATISTICA
Tabelul 2.6.3
Grupe de muncitori dup producie (buci) 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 80 - 84 Total Date convenionale. Nr. muncitori 2 7 15 21 10 6 4 65 - intervale egale Producie cumulat (buci) 101 405 913 1407 754 462 328 4370
Gruparea pe intervale neegale n continuare vom regrupa muncitorii astfel nct s evideniem trei tipuri calitative din punct de vedere al produciei realizate: mic, mijlociu, mare. Folosind criteriul mediei, definim tipul mijlociu prin reunirea a trei intervale: intervalul care conine media (65 - 69) i cele dou intervale alturate (60 - 64 i 70 - 74). Noua grupare este prezentat n tabelul 2.6.4.
Gruparea muncitorilor dup producia realizat Tabelul 2.6.4. Producia lunar - mic - mijlocie - mare Total Intervale (buci) 50 - 59 60 - 74 75 - 84 Nr. muncitori 9 46 10 65 - intervale neegale Producia cumulat (buci) 506 3074 790 4370
n scopul unei prezentri ordonate, sugestive a informaiilor i pentru sistematizarea datelor n vederea prelucrrii, n statistic sunt frecvent utilizate tabelele. Tabelele sunt formate dintr-o reea de rubrici coninnd date numerice i text care permit caracterizarea statistic a fenomenului studiat n condiii specifice de timp i spaiu. n continuare sunt prezentate elementele obligatorii de coninut i de form pe care le regsim ntr-un tabel, cu exemplificare pe tabelul 2.7.1. Titlul tabelului precizeaz caracteristica sau caracteristicile principale la care se refer datele prezentate; pe lng acest titlu general, n interiorul tabelului pot exista subtitluri, care se refer la elementele componente ale subiectului i predicatului. Subiectul este reprezentat de colectivitatea statistic supus analizei i se nscrie n capetele rndurilor; n exemplul considerat subiectul este reprezentat de grupele de ri n care export Romnia. Predicatul este format din sistemul de caracteristici pentru care s-a fcut centralizarea datelor. Acestea se nscriu n capetele coloanelor. n tabelul 2.7.1 predicatul este valoarea exportului. Unitatea de msur se nscrie distinct pentru fiecare caracteristic n coloana respectiv. Dac este comun tuturor datelor se trece deasupra tabelului, n dreapta. Sursa de date. Notele explicative sunt utilizate atunci cnd este necesar s se clarifice unele abordri metodologice sau noiuni mai puin cunoscute. Deoarece n tabel nu pot exista rubrici necompletate, atunci cnd nu se cunosc anumite date, n locul lor se nscrie semnul , iar dac valoarea respectiv nu poate exista, rubrica conine semnul - . O alt regul de ntocmire a tabelelor se refer la alegerea unitilor de msur n funcie de tipul i gradul de variaie a mrimii datelor, astfel nct nscrierea lor n tabel s fie convenabil. De exemplu,
STATISTICA
producia se va exprima n mii sau milioane lei la nivelul unei societi comerciale, dar n miliarde lei la nivelul ramurii sau al ansamblului economiei; personalul unei uniti economice poate fi exprimat n uniti sau zeci, dar populaia ocupat pe ramuri i pe economie se msoar n mii sau milioane de persoane. Corespunztor varietii de grupri posibile, exist mai multe tipuri de tabele statistice. Tabelul descriptiv este utilizat pentru nregistrarea i prezentarea datelor primare n etapa culegerii datelor. Tabelul simplu nscrie indicatori statistici ordonai din punct de vedere cronologic, teritorial sau organizatoric. Exemplu: tabelul 2.7.1.
Exportul Romniei pe grupe de ri n luna ianuarie 2002 Tabelul 2.7.1
Uniunea European ri din Europa Central i de Est Alte ri Total Exporturi FOB (mil. dolari) 559,3 85,6 266,8 911,7
Tabelul pe grupe prezint rezultatele unei grupri simple cu centralizarea numrului unitilor pe grupe (frecvene, vezi col. 1 a tab. 2.7.2.). Totodat, se centralizeaz pe grupe valorile unor caracteristici dependente de caracteristica de grupare (vezi tab. 2.7.2., col.2 i col.3). Acest tip de tabel poate fi utilizat n analiza corelaiei statistice ntruct evideniaz legturile dintre variaia caracteristicii de grupare i caracteristicile dependente. Exemplu: tabelul 2.7.2.
Principalii indicatori ai unitilor de cercetare-dezvoltare n anul 2000 Tabelul 2.7.2
Numr uniti 0 Sectorul ntreprinderi Sectorul guvernamental Sectorul nvmnt superior Total 1 439 110 52 601 Numr salariai *) 2 22541 7571 3780 33892 Cheltuieli (mld. lei) 3 5680 1981 349 8010
numr persoane n echivalent norm ntreag. Sursa: Anuarul statistic al Romniei, anul 2001, p. 228 i 232.
*)
Tabelul combinat reflect o grupare a datelor dup cel puin dou caracteristici. Acest tip de tabel permite att analiza separat a formei de variaie a celor dou caracteristici luate independent, ct i analiza legturilor dintre ele. Ofer o bun sistematizare a datelor n vederea aplicrii metodelor de calcul a corelaiei. Exemplu: tabelul 2.7.3.
Situaia omerilor nregistrai, pe categorii de personal, la sfritul lunii ianuarie 2002 Tabelul 2.7.3 Categorii de omeri Sex Numr persoane Muncitori M 544584 F 378715 Total 1 923299 Cu studii medii M 104864 F 135288 Total 2 240152 Cu studii superioare M 14257 F 16013 Total 3 30270 Total general 1193721 Sursa: Buletin statistic lunar, Institutul Naional de Statistic, nr. 1,2002.
Tabelul cu dubl intrare este o variant a tabelului combinat care prezint variaia simultan a colectivitii dup dou caracteristici: una cauzal (factor de influen) i cealalt rezultativ (dependent). Exemplificare: tabelul 2.7.4.
Distribuia elevilor unei coli generale dup vrst i nlime Tabelul 2.7.4 Vrst (ani) Total dup 6-9 10-12 13-15 nlime nlime (cm) 120-130 30 5 35 130-140 50 120 170 140-150 28 180 50 258 150-160 75 175 250 160-170 40 210 250 Total dup vrst 108 420 435 963 Date convenionale.
STATISTICA
Coninutul acestui tabel l formeaz frecvenele exprimate pentru una din caracteristici (totalurile pariale pe linii i pe coloane) sau n funcie de ambele caracteristici de grupare simultan (interiorul tabelului). De exemplu, numrul elevilor cu vrsta ntre 6 i 9 ani, avnd nlimea cuprins n intervalul 120-130 cm este de 30. Acest tabel permite s se evidenieze att variaia celor dou caracteristici analizate separat, ct i legtura de interdependen dintre ele; din acest motiv este util pentru analiza legturilor dintre variabile. O form particular a acestui tip de tabel o reprezint tabelul de asociere (vezi tabelul 2.7.5), care se utilizeaz n cazul caracteristicilor alternative. Acestea sunt variabile care nu admit dect dou forme de manifestare (candidat admis-respins, norme ndeplinite-nendeplinite, produs bun-rebutat, familii cu copii-fr copii etc.).
Populaia masculin i feminin pe medii la 1 iulie 2000 Tabelul 2.7.5 Total Populaie (mii persoane) feminin masculin urban 6.336,7 5.907,9 12.244,6 rural 5.129,6 5061,0 10.190,6 Total 11.466,3 10968,9 22.435,2 Sursa: Calcule pe baza Anuarului statistic al Romniei, anul 2001, p.49,50 i 52. Mediul
n cadrul analizelor statistice datele se utilizeaz sub o form ordonat, ca serii statistice. Seriile statistice pot fi formate din mrimi absolute sau mrimi derivate. Seria statistic se prezint sub forma a dou iruri paralele, ntre care exist o coresponden. Primul ir arat variaia caracteristicii de grupare: valori, variante, intervale de variaie. Al doilea ir reflect frecvenele de apariie a valorilor precedente sau valorile unei alte caracteristici interdependente. Seria statistic se obine prin operaii de grupare sau clasificare sau prin descrierea evoluiei unui fenomen n timp sau n spaiu. Natura caracteristicii de grupare determin ncadrarea seriei statistice ntr-una din
urmtoarele categorii: serii de timp; serii teritoriale; serii de distribuie. 1. Seriile de timp (cronologice, dinamice) arat evoluia n dinamic a fenomenului analizat. Forma lor general de prezentare este ilustrat n tabelul 2.7.6.
Seria cronologic Variabila timp (ti)
t1 t2 tn
y1 y2
yn
Seriile cronologice pot fi de dou tipuri: serii de intervale i serii de momente. Seriile de intervale exprim rezultatele activitii depuse pe parcursul unei perioade de timp. De exemplu: producii anuale obinute de o societate comercial, cheltuieli trimestriale de producie, vnzarea lunar de bunuri alimentare etc. Termenii acestor serii sunt nsumabili. O serie de intervale este prezentat n tabelul 2.7.7
nmatriculri noi de vehicule pentru transportul mrfurilor n anul 2001 Tabelul 2.7.7 Trimestrul Numr vehicule I 3449 II 4005 III 3885 IV 4997
Seriile de momente arat valoarea caracteristicii la un moment dat. De exemplu, populaia Romniei la 18 martie 2002 (data celui mai recent recensmnt), valoarea stocurilor unei uniti comerciale la nceputul fiecrei luni, mrimea capitalului fix la 31 decembrie. nsumarea termenilor acestor serii nu are sens deoarece conduce la nregistrri repetate.
STATISTICA
Un exemplu de astfel de serie statistic este prezentat n tabelul 2.7.8. Populaia Romniei la recensmnt, n perioada 1930-2002 Tabelul 2.7.8 Data Numrul locuitorilor (mii persoane) 29 decembrie 1930 14.280,7 25 ianuarie 1948 15.872,6 21 februarie 1956 17.489,5 15 martie 1966 19.103,2 5 ianuarie 1977 21.559,9 7 ianuarie 1992 22.810,0 18 martie 2002 21.682,0 Sursa: Anuarul statistic al Romniei, anul 1997, date INS.
2. Seriile de spaiu (teritoriale) prezint repartiia unitilor colectivitii dup caracteristici teritorial-administrative. De exemplu: producia industrial pe judee, populaia pe localiti, desfacerile de mrfuri pe principalele orae ale rii, numrul unitilor de cazare pe destinaii turistice sau populaia pe ri (vezi tabelul 2.7.9).
Populaia n unele ri din centrul i estul Europei n anul 2000 Tabelul 2.7.9 Numrul populaiei (mii persoane) Bulgaria 8136 Cehia 10222 Polonia 37955 Romnia 22338 Ungaria 9927 Slovacia 5377 Slovenia 1988 Sursa: Employment and labour market in Central European countries, EUROSTAT,2001, p.60. ara
3. Seriile de distribuie (repartiie) corespund caracteristicilor atributive numerice sau calitative (exprimate n cuvinte), folosite ca factori de grupare. n acest caz centralizarea se face pentru aceeai
caracteristic sau pentru o caracteristic interdependent. Caracteristicile calitative se refer frecvent la clasificri cum sunt: repartiia salariailor pe profesii, valoarea adugat brut pe ramuri ale economiei, distribuia mijloacelor fixe pe forme de proprietate, populaia pe sexe, repartiia studenilor pe specializri sau numrul locurilor pe faculti la admiterea n ASE (tabelul 2.7.10).
Numrul locurilor la admiterea n ASE pentru nvmntul de zi n anul 2002 Tabelul 2.7.10 Denumirea facultii Facultatea de MANAGEMENT Facultatea de CONTABILITATE SI INFORMATIC DE GESTIUNE Facultatea de FINANE, ASIGURRI, BNCI SI BURSE DE VALORI Facultatea de ECONOMIE GENERAL Facultatea de ECONOMIA AGROALIMENTAR I A MEDIULUI Facultatea de CIBERNETIC, STATISTIC I INFORMATIC ECONOMIC Facultatea de COMER Facultatea de RELAII ECONOMICE INTERNAIONALE Facultatea de STUDII ECONOMICE N LIMBI STRINE
Nr. locuri
950 620 620 300 390 520 620 440 320
Seria realizat pe baza unei caracteristici cantitative se mai numete i serie de variaie. De exemplu: repartiia societilor comerciale dup mrimea profitului anual realizat. n cazul distribuiilor dup o caracteristic cantitativ, de regul, cel de-al doilea ir al seriei este format din frecvenele corespunztoare grupelor: serii de distribuie de frecvene pe variante (tabelul 2.7.11) sau pe intervale de variaie (tabelul 2.6.3.).
STATISTICA
Tabelul 2.7.11
Locul 1 2 Frecvena 74 83 Sursa: Anuarul statistic al Romniei, anul 2001, p.266. 3 109
Seriile statistice sunt rezultatul sistematizrii datelor, care sunt astfel pregtite pentru prelucrri ulterioare.
2.7.3 Grafice statistice
O prezentare sugestiv i accesibil a informaiei statistice, dei mai puin precis dect tabelele i seriile statistice, se poate realiza prin intermediul graficelor. Graficul permite evidenierea: variaiei valorilor observate; densitii de repartiie a frecvenelor; raporturilor de mrime; interdependenelor dintre indicatori. Graficele reprezint un mijloc de prezentare a rezultatelor sistematizrii datelor n etapa prelucrrii primare. n faza de prelucrare a datelor, graficul orienteaz alegerea modelelor de calcul statistic (de exemplu, alegerea metodei de ajustare a seriilor cronologice, alegerea funciei matematice dup care se realizeaz corelaia etc.). Elementele care definesc un grafic sunt: titlul, reeaua graficului, axele de coordonate, scara de reprezentare, note explicative (sursa datelor, legenda simbolurilor utilizate). Titlul graficului coincide frecvent cu titlul tabelului pe care l reprezint. Trebuie s satisfac aceleai condiii: claritate, identificare concis a fenomenului reprezentat i localizarea acestuia n timp i spaiu. Reeaua graficului este format din sistemul de linii paralele (verticale i orizontale) care ghideaz amplasarea pe grafic a mrimilor reprezentate, dac se utilizeaz sistemul de coordonate rectangulare. n cazul folosirii coordonatelor polare, reeaua este format din cercuri concentrice.
De regul, graficele statistice utilizeaz sistemul de coordonate rectangulare. Pe axa absciselor (OX) se trec variantele sau intervalele de variaie ale caracteristicii independente, momentele sau intervalele de timp. Pe axa ordonatelor (OY) apar valorile caracteristicii dependente sau frecvenele. Scara de reprezentare se alege n funcie de numrul indicatorilor de reprezentat i ordinul lor de mrime, astfel nct imaginea graficului s fie clar i sugestiv. Scrile de reprezentare pot fi rectilinii sau curbilinii, n funcie de tipul graficului. Scara aritmetic (uniform) presupune distane egale ntre diviziuni. n anumite situaii sunt necesare modaliti diferite de reprezentare. De exemplu, n cazul scrii logaritmice, distanele dintre diviziuni sunt determinate de logaritmul mrimilor de reprezentare (lg xi, lg yi). Pe un grafic pot fi folosite dou scri de reprezentare. Legenda graficului prezint semnificaia semnelor utilizate: simboluri, prescurtri, hauri. Se plaseaz n dreapta graficului. Sursa datelor explic proveniena datelor reale folosite n grafic. Se trece sub grafic. n practica statistic se folosesc diferite tipuri de grafice pentru a evidenia raporturile de mrime dintre indicatori. Graficele prin coloane permit o vizualizare rapid a diferenelor de mrime dintre indicatori sau a evoluiei lor n timp. Mrimile indicatorilor prezentai sunt reflectate prin coloane cu baze egale i nlimea proporional cu nivelul indicatorilor. Coloanele pot fi simple (cu distane egale ntre ele sau lipite), cu subdiviziuni i cu orientare n dublu sens (pozitiv, negativ) dup cum se poate vedea n figura 2.7.12. Deasupra fiecrei coloane se poate trece mrimea reprezentat.
STATISTICA
Consum ap (m )
Ian Feb Mar
80 60 40 20 0 Ian Feb Mar Apr Mai Iun
Energie electrica
Gaze
Apa
Realizari lunare
Ian
Feb
Mar
Apr
Mai
Iun
Acest tip de grafic se folosete pentru un numr redus de valori de reprezentare. n caz contrar, graficul devine prea ncrcat i se prefer cronograma. Reprezint o bun modalitate de popularizare a datelor statistice. Se folosete pentru serii de repartiie (variabile discrete), pentru serii cronologice i teritoriale.
Graficele prin benzi sunt asemntoare celor precedente, cu diferena c nivelul indicatorilor este reprezentat prin benzi orizontale de lime egal i de lungime proporional cu mrimea acestora. Benzile sunt egal distanate. Aceste grafice sunt folosite n cazul indicatorilor care pot fi structurai pe componente (fig. 2.7.13) atunci cnd termenii seriei exprim lungimi, i pentru indicatorii eterogeni cu variaii foarte mari.
1997
1996
1995
1994
1993
1992
1991
1990
11 10 9 8 7 6 5 4 3 2 1 0
export (mld. $)
0 1 2 3 4 5 6 7 8 9 10 11 12 13
import (mld. $)
Variante de grafice prin benzi: simple, grupate, cu subdiviziuni i orientate n dublu sens (vezi figura 2.7.14).
Grafic prin benzi simple
Grafic prin benzi grupate
1998
50
100
150
200
250
300
350
50
100
150
200
250
100
200
300
-30
-20
-10
10
20
STATISTICA
Graficele care folosesc figuri geometrice sunt utilizate pentru a reda fie mrimea (diagramele de volum), fie structura colectivitii (diagramele de structur). Diagramele de volum folosesc ptratul i cercul pentru a reda fenomene unidimensionale, dreptunghiul, pentru a reprezenta indicatori care se exprim ca produs ntre doi factori i paralelipipedul pentru acei indicatori care se pot determina ca produs ntre trei factori. Ptratele reprezint prin suprafeele lor mrimea indicatorilor considerai. Pentru a asigura proporionalitatea ntre mrimea indicatorilor de reprezentat grafic i suprafaa ptratelor se pornete de la relaia:
Mi = li2, unde: Mi - mrimea indicatorului; li - latura ptratului. n consecin, pentru fiecare indicator Mi se va construi un ptrat cu latura li. Cercurile folosite n reprezentrile grafice au suprafaa proporional cu mrimea indicatorilor respectivi, conform relaiei:
M i = Ri2 Ri = Mi ,
unde: Ri - raza cercului . Dreptunghiul se folosete pentru reprezentarea grafic a indicatorilor care pot fi exprimai ca produs ntre doi factori, cum sunt: - valoarea produciei n funcie de producia fizic i pre; - consumul unei materii prime n funcie de consumul specific i producia fizic; - producia n funcie de eficiena capitalului fix i valoarea acestuia; - productivitatea muncii, ca produs ntre eficiena capitalului fix i nzestrarea tehnic a muncitorului. Comparativ cu cercul i ptratul, care redau prin suprafeele lor mrimea indicatorilor, dreptunghiul evideniaz n plus valorile factorilor de influen. Cei doi factori sunt reprezentai pe nlimea i baza
dreptunghiului. De exemplu, cu ajutorul dreptunghiului se pot compara grafic (fig. 2.7.15) produciile a trei uniti agricole A, B i C. Suprafaa dreptunghiului evideniaz mrimea produciei, care depinde de producia medie/ha (redat prin nlimea dreptunghiului) i de suprafa arabil (baza dreptunghiului).
STATISTICA
mii pers. 3600 3100 2600 2100 1600 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 anul
Sursa: Anuarul statistic al Romniei, 2001, p.104. Fig. 2.7.16 Numrul mediu de salariai n industrie (cronograma)
Diagramele semilogaritmice sunt grafice care folosesc dou scri de reprezentare: pe Ox, scar aritmetic cu distane egale ntre diviziuni 0 1 2 3 4 5 6
O x pe Oy, scar logaritmic, avnd distanele dintre diviziuni proporionale cu logaritmii zecimali. 1 10 100 1000 10000 100000 O y n timp ce pe scara aritmetic distane egale corespund unor variaii absolute egale, pe scara logaritmic dou distane egale reprezint dou variaii relative egale. Indicatorii care prezint un ritm constant de cretere (progresie geometric) vor avea pe scara semilogaritmic, o reprezentare grafic sub forma unor drepte. Utilizarea acestui tip de grafic este indicat pentru o mai bun prezentare a variaiilor relative ale indicatorilor. Totodat, atunci cnd ntre indicatorii reprezentai grafic sunt diferene mari ca ordin de
mrime, utilizarea scrii logaritmice reduce mult distanele, permind prezentarea lor pe acelai grafic. Diagramele radiale (fig. 2.7.17) sunt deosebit de sugestive pentru reprezentarea fenomenelor cu variaii sezoniere. Cercul se mparte ntr-un anumit numr de sectoare egale, n funcie de numrul intervalelor de timp reprezentate. De exemplu, un an poate fi mprit n 12 luni (deci 12 sectoare), n 4 trimestre (4 sectoare) sau n 2 semestre (2 sectoare). Lungimea razei fiecrui sector este proporional cu mrimea indicatorului de reprezentat: transporturi navale, activitate turistic, consumul unor alimente (ngheat, fructe i legume) sau alte activiti cu caracter sezonier.
1 10 180 160 140 120 100 80 60 40 20 0 2
7 6
Cartogramele se folosesc pentru reprezentarea seriilor de spaiu. Ele au forma unor hri pe care unitile administrativ-teritoriale sunt diferit haurate sau colorate n funcie de mrimea indicatorului de reprezentat. Diagramele de distribuie, specifice seriilor de repartiie de frecvene includ: histograma, poligonul frecvenelor, poligonul frecvenelor cumulate cresctor/descresctor i curba de concentrare (Lorenz).
STATISTICA
Histograma (figura 2.7.18) este un tip de grafic cu un aspect asemntor diagramei cu coloane lipite, dar cu semnificaie diferit. Bazele coloanelor corespund grupelor colectivitii i pot fi egale, n cazul unei grupri pe intervale egale sau inegale, dac gruparea s-a fcut pe intervale neegale de variaie.
numr salariati 50 40 30 20 10 0 5 10 15 20 25 30 vechime (ani)
nlimea coloanelor este proporional cu frecvena grupelor n cazul intervalelor de grupare egale. n cazul n care s-a utilizat o grupare pe intervale neegale, nu nlimea, ci suprafaa coloanelor este proporional cu frecvena grupelor. Se calculeaz un coeficient de reducere a frecvenelor n funcie de mrimea fiecrui interval, comparativ cu intervalul minim. Frecvenele reduse, obinute prin mprirea frecvenei absolute a fiecrei grupe la coeficientul de reducere corespunztor grupei respective, se folosesc la reprezentarea grafic drept nlimi ale coloanelor histogramei. n acest fel, suprafaa fiecrei coloane este proporional cu produsul dintre mrimea intervalului respectiv i frecvena sa redus, produs care corespunde de fapt frecvenei absolute. Poligonul frecvenelor (figura 2.7.19) este similar histogramei din punct de vedere al coninutului informaional, dar are o form grafic diferit. Construirea poligonului frecvenelor presupune ca pentru fiecare grup s se plaseze cte un punct pe perpendiculara ridicat din centrul intervalului la nlimea corespunztoare frecvenei grupei respective. Unind aceste puncte prin segmente de dreapt se obine o linie frnt. Putem face ca poligonul frecvenelor s ating axa absciselor extinznd-o
la centrul unor intervale imaginare la stnga i la dreapta graficului. Evident, aceste intervale au frecvena zero.
Nr. muncitori 60 50 40 30 20 10 0
1,5 2 2,5 3 3,5 4 4,5
48 30 14 0 18
25 15 0
Poligonul frecvenelor cumulate reprezint grafic frecvenele cumulate cresctor sau descresctor. Frecvena cumulat cresctor a unei grupe i se obine nsumnd succesiv frecvenele tuturor intervalelor anterioare (inclusiv frecvena grupei date). Semnificaia indicatorului: numrul unitilor colectivitii care au valoarea caracteristicii cel mult egal cu limita superioar a intervalului dat. Frecvena cumulat descresctor a unei grupe i se determin ca sum a frecvenelor tuturor grupelor care urmeaz grupei respective (inclusiv frecvena acesteia). Cumularea frecvenelor ncepe de la ultima grup spre prima. Semnificaie: numrul unitilor care au valoarea caracteristicii cel puin egal cu limita inferioar a intervalului dat. Construirea curbei frecvenelor cumulate cresctor: pe Ox se trec intervalele de variaie, iar pe Oy frecvenele cumulate cresctor. Se ridic o perpendicular din limita superioar a fiecrui interval i se marcheaz un punct la o nlime dat de frecvena cumulat a intervalului respectiv. Pentru curba frecvenelor cumulate descresctor se folosesc limitele inferioare ale intervalelor de pe Ox, iar pe Oy se trec frecvenele cumulate descresctor. Exemplificri ale acestor curbe vor fi prezentate n capitolul 4.
STATISTICA
Ogiva este o anumit form a curbei frecvenelor cumulate, ntlnit n situaia unei distribuii simetrice a frecvenelor.
Curba de concentrare (fig. 2.7.20) folosete frecvenele relative cumulate. Pe cele dou axe de coordonate se trec greutile specifice cumulate calculate pentru dou serii statistice. Punctele situate la ntretierea coordonatelor celor dou caracteristici formeaz o curb care ilustreaz gradul de concentrare.
100
% vechime cumulate
80 60 40 20 0
0 20 40 60 80 100
% frecvente cumulate
Corelograma sau graficul norului de puncte (fig. 2.7.21) este folosit pentru evidenierea legturilor dintre caracteristici, n cazul repartiiilor bidimensionale.
1035 990 945 900 mii lei 855 810 765 720 675 2 8 14 20 26 32 38 ani
n cazul popularizrii datelor statistice, unele publicaii folosesc i diagrame prin figuri naturale. Mrimea figurilor red ordinul de mrime al indicatorului reprezentat.
2.8 NTREBRI I TESTE-GRIL 2.8.1 ntrebri recapitulative 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15.
n ce const observarea statistic? Ce surse de date statistice cunoatei? Ce probleme metodologice trebuie rezolvate n cadrul etapei de observare statistic? Ce nelegei prin probleme organizatorice n cadrul etapei de observare statistic? Ce nelegei prin observare total? Ce nelegei prin observare parial? Ce nelegei prin observare unic? Ce nelegei prin observare permanent? Ce nelegei prin observare periodic? Ce accepiuni are timpul observrii? Ce tipuri de formulare statistice cunoatei? Care sunt principalele metode de observare special organizate? Care sunt trsturile caracteristice ale recensmntului? Care sunt trsturile caracteristice ale sondajului statistic? Care sunt trsturile caracteristice ale anchetei statistice?
STATISTICA
16. Care sunt trsturile caracteristice ale unei monografii? 17. Care este deosebirea de fond ntre ancheta statistic i sondajul statistic? 18. Ce sunt erorile de observare i de cte feluri sunt? 19. Prin ce se caracterizeaz erorile de observare ntmpltoare? 20. Prin ce se caracterizeaz erorile de observare sistematice? 21. Care este deosebirea de fond ntre erorile de observare ntmpltoare i cele sistematice? 22. Cum se nltur erorile de observare? 23. Ce nelegei prin control al completitudinii datelor observrii? 24. Ce nelegei prin control aritmetic al datelor de observare? 25. Ce nelegei prin control logic al datelor de observare? 26. Care sunt principalele metode de sistematizare a datelor statistice? 27. Ce nelegei prin gruparea datelor statistice? 28. Cnd se procedeaz la gruparea pe variante? 29. Ce nelegei prin grupare simpl? 30. Ce nelegei prin grupare combinat? 31. Cnd se procedeaz la gruparea pe intervale de variaie egale? 32. Cnd se procedeaz la gruparea pe intervale de variaie neegale? 33. Cnd se procedeaz la gruparea combinat? 34. Cum se pot sistematiza datele dup o variabil discret? 35. Cum se pot sistematiza datele dup o variabil continu? 36. Cum se stabilesc limitele intervalelor n cazul gruprii pe intervale dup o variabil cu variaie continu? 37. Cum se stabilesc limitele intervalelor n cazul gruprii pe intervale dup o variabil cu variaie discret? 38. Cum se determin mijlocul unui interval? 39. Cum se poate determina mrimea intervalului de grupare? 40. Cum se determin numrul de grupe la gruparea pe intervale egale? 41. Ce criteriu se poate folosi pentru gruparea pe intervale neegale cu evidenierea tipurilor calitative? 42. Cum se poate aplica criteriul mediei? 43. Ce principii trebuie respectate pentru ca o grupare s fie corect? 44. Ce nelegei prin clasificare?
45. Pentru ce tip de variabil statistic se folosete, de regul, clasificarea? 46. Ce clasificri oficiale cunoatei? 47. Ce condiii trebuie sa ndeplineasc datele statistice pentru a putea fi centralizate? 48. Cum se reprezint grafic valoarea centralizat a unei variabile statistice? 49. Ce este o serie statistic? 50. Ce este o distribuie de frecvene? Exemplificai. 51. Ce nelegei prin serii cronologice (de timp)? Exemplificai. 52. Ce nelegei prin serii teritoriale (de spaiu)? Exemplificai. 53. Ce nelegei prin serii de distribuie a frecvenelor unidimensionale? 54. Ce nelegei prin serii de distribuie a frecvenelor bidimensionale? 55. Ce rezult prin sistematizarea datelor dup o variabil atributiv? 56. Ce rezult prin sistematizarea datelor dup o variabil de timp? 57. Ce rezult prin sistematizarea datelor dup o variabil de spaiu? 58. Cum se reprezint grafic o distribuie de frecvene rezultat prin gruparea dup o variabil cantitativ? 59. Prin ce se reprezint grafic o distribuie de frecvene rezultat prin gruparea dup o variabil discret? 60. Prin ce se reprezint grafic o distribuie de frecvene rezultat prin gruparea dup o variabil continu? 61. Prin ce se reprezint grafic o distribuie de frecvene rezultat prin gruparea pe variante? 62. Prin ce se reprezint grafic o distribuie de frecvene rezultat prin gruparea pe intervale de variaie egale? 63. Prin ce se reprezint grafic o distribuie de frecvene rezultat prin gruparea pe intervale de variaie neegale? 64. Prin ce se reprezint grafic o distribuie de frecvene rezultat prin gruparea pe intervale de variaie neegale cu evidenierea tipurilor calitative? 65. Pentru ce se poate utiliza poligonul frecvenelor cumulate? 66. Ce reguli trebuie respectate la construirea histogramei? 67. Prin ce se reprezint grafic seriile de timp?
STATISTICA
68. Prin ce se reprezint grafic seriile de spaiu? 69. Cum se prezint o serie de distribuie de frecvene unidimensional? 70. Cum se prezint o serie de distribuie de frecvene bidimensional? 71. Cum se prezint o serie cronologic? 72. Cum se prezint o serie teritorial? 2.8.2 Teste-gril 1. Etapele principale ale cercetrii statistice sunt: a) observarea; b) prelucrarea; c) analiza i interpretarea; d) decizia. Alegei combinaia corect: A(a,b,c); B(a,b,c,d); C(c,d). 2. Elementul constitutiv al colectivitii supuse investigaiei statistice este: a) populaia statistic; b) unitatea statistic; c) caracteristica statistic; d) modelul; e) informaia. 3. Ansamblul elementelor de aceeai natur supuse investigaiei statistice reprezint: a) populaia statistic; b) unitatea statistic; c) caracteristica statistic; d) modelul; e) informaia. 4. Criteriul pe baza cruia se caracterizeaz unitatea statistic este: a) populaia statistic; b) unitatea statistic; c) caracteristica statistic; d) modelul; e) informaia.
5. Caracteristicile statistice pot fi: a) de timp, de spaiu sau atributive; b) alternative sau nealternative; c) primare sau derivate; d) calitative sau cantitative; e) empirice sau teoretice. Alegei combinaia corect: A(a,b,c,d,e); B(a,b,c,d); C(d,e); D(a,c,e). 6. Vrsta este o caracteristic statistic: a) atributiv numeric; b) derivat; c) calitativ nealternativ; d)de timp. 7. Variabila numrul salariailor este o caracteristic statistic: a) calitativ; b) continu; c) discret; d) alternativ. 8. Caracteristica statistic profesie este: a) calitativ; b) continu; c) discret; d) alternativ. 9. Productivitatea muncii este o caracteristic statistic: a) calitativ; b) derivat; c) discret; d) alternativ. 10. Caracteristicile statistice pot fi: a) de timp; b) de spaiu; c) atributive; d) reprezentative. Alegei combinaia corect: A(a,b,c); B(a,b,c,d); C(a,d).
STATISTICA
11. Colectivitile statistice pot fi: a) de timp, de spaiu sau atributive; b) alternative sau nealternative; c) primare sau derivate; d) calitative sau cantitative; e) statice sau dinamice. 12. Este o observare total: a) ancheta statistic; b) recensmntul; c) sondajul statistic; d) observarea prii principale. 13. Este o observare permanent: a) ancheta statistic; b) recensmntul; c) sondajul statistic; d) observarea prii principale; e) raportul statistic. 14. Sondajul statistic se caracterizeaz prin: a) rapiditate; b) economicitate; c) este o observare parial; d) erori de nregistrare mai mici. Alegei combinaia corect: A(a,b,c,d); B(c,d); C(a,d). 15. Datele obinute prin observare sunt supuse unui control: a) de volum; b) aritmetic; c) logic; d) economic. Alegei combinaia corect: A(a,b,c,); B(c,d); C(a,d). 16. Atunci cnd variabila nregistrat prezint un numr redus de variante se recomand: a) gruparea pe variante; b) gruparea pe intervale de variaie; c) gruparea combinat; d) gruparea pe tipuri calitative.
17. Atunci cnd variabila nregistrat prezint un numr mare de valori individuale distincte se recomand: a) gruparea pe variante; b) gruparea pe intervale de variaie; c) gruparea combinat; d) gruparea pe tipuri calitative. 18. n cazul n care se urmrete structura colectivitii simultan dup dou caracteristici numerice se recomand: a) gruparea pe variante; b) gruparea simpl; c) gruparea combinat; d) gruparea pe tipuri calitative. 19. Elementele obligatorii ale unui tabel statistic sunt: a) subiectul; b) predicatul; c) reeaua de rnduri i coloane; d) titlul general i titlurile interioare; e) sursa datelor. Alegei combinaia corect: A(a,b,c,d,e); B(c,d); C(a,b). 20. Seriile statistice pot fi: a) de timp; b) de spaiu; c) de distribuie a frecvenelor; d) de evoluie. Alegei combinaia corect: A(a,b,c); B(c,d); C(a,d). 21. n vederea prezentrii caracteristicilor atributive numerice se folosesc serii statistice: a) de timp; b) de spaiu; c) de distribuie a frecvenelor; d) orice tip. 22. n vederea prezentrii evoluiei n timp a unui fenomen se folosesc serii statistice: a) cronologice;
STATISTICA