Home - Rasfoiesc.com
Educatie Sanatate Inginerie Business Familie Hobby Legal
Doar rabdarea si perseverenta in invatare aduce rezultate bune.stiinta, numere naturale, teoreme, multimi, calcule, ecuatii, sisteme




Biologie Chimie Didactica Fizica Geografie Informatica
Istorie Literatura Matematica Psihologie

Statistica


Index » educatie » » matematica » Statistica
» Metode de analiza statistica a legaturilor dintre variabilele economice


Metode de analiza statistica a legaturilor dintre variabilele economice


METODE DE ANALIZA STATISTICA A LEGATURILOR DINTRE VARIABILELE ECONOMICE

Continut:

1. Conceptul de legatura statistica. Tipuri de legaturi;

2. Metode elementare de caracterizare a legaturilor dintre variabile;

3. Metoda regresiei;



4. Indicatori statistici ai corelatiei;

Rezumat: Aprecierea existentei legaturilor dintre variabilele economice, dar mai ales masurarea intensitatii acestor legaturi raman doua dintre principalele obiective ale statisticii practice. Din acest motiv, intelegerea conceptului de legatura statistica, prezentat pe larg in debutul acestui capitol, precum si a diversitatii legaturilor statistice posibile , sunt esentiale pentru intregul demers viitor. Dupa o scurta trecere in revista a metodelor elementare, mai mult intuitive, de caracterizare a legaturilor dintre variabile, este prezentata metoda regresiei, pe exemplul concret al regresiei de tip liniar, dar cu scurte introspectii si in alte tipuri de regresie. In final, sunt reliefati indicatorii statistici ai corelatiei (raportul si coeficientul de corelatie), insistandu-se si pe metodele neparametrice si parametrice de verificare a semnificatiei ecuatiei de regresie, coeficientilor de corelatie si intensitatii legaturilor dintre variabile in general.

1. Conceptul de legatura statistica. Tipuri de legaturi.

Variabilele economice reprezinta rezultatul unei multitudini de factori, unii principali, altii secundari, sau intr-o alta acceptiune, unii esentiali, altii neesentiali.

Una dintre preocuparile majore ale statisticii este evidentierea si masurarea influentei acestor factori asupra variabilelor, demers care comporta o serie de dificultati legate in primul rand de complexitatea relatiilor, precum si de faptul ca relatiile de cauzalitate nu sunt deterministe si se manifesta in general tot sub forma de tendinta. In plus, se manifesta, cu predilectie intre factorii calitativi, o serie intreaga de interdependente care nu pot fii masurate cu exactitate, ducand la acceptarea masurilor inexacte ca masuri variabile pentru legaturile dintre variabile.

Legaturile de tip statistic sunt diferite de cele tehnice, a caror manifestare este in general matematica, algoritmica si parametrica.

De asemenea, exista diferente majore intre legaturile de tip statistic si cele de tip functional. In cazul legaturilor functionale exista o relatie de tipul : yi=f(xi), care stabileste o corespondenta intre argumentul xi si valoarea yi a functiei, corespondenta care poate fi formalizata. Aceasta forma de legatura nu e proprie fenomenelor social-economice, legaturile dintre acestea fiind legaturi statistice sau stohastice. In cadrul acestui gen de legaturi: x - este o caracteristica factoriala (factor);

y - este caracteristica rezultativa,

astfel incat x il influenteaza pe y, (x y), sau cu alte cuvinte variatia caracteristicii rezultative depinde intr-o anumita masura de variatia caracteristicii factoriale .

Legaturile statistice pot fii clasificate dupa mai multe criterii:

a)     dupa numarul caracteristicilor factoriale: legaturi simple x y si multiple: x1, x2, . .xn y;

b)     dupa felul de exprimare a variabilelor: legaturi intre variabile numerice si legaturi inte variabile exprimate prin cuvinte;

c)     dupa directia legaturilor

legaturi directe - la care cresterea, respectiv descresterea caracteristicii factoriale determina cresterea, respectiv descresterea caracteristicii rezultative;

legaturi inverse - cresterea/descresterea caracteristicii factoriale determina descresterea/cresterea caracteristicii rezultative;

d)     dupa expresia analitica : legaturi liniare - exprimate printr-o functie de gradul I si legaturi neliniare - exprimate printr-o functie hiperbolica, s.a;

e)     dupa timpul in care se produce legatura

legaturi concomitente sau sincrone - in care variatia caracteristicii rezultative se produce concomitent cu cea a caracteristicii functionale;

legaturi asincrone sau cu decalaj - in care variatia caracteristicii rezultative se produce la un anumit interval de timp fata de variatia factorului .

2. Metode elementare de caracterizarea a legaturilor dintre variabile

Exista 4 metode elementare care arata cu un anumit grad de certitudine ca intre unele variabile exista legaturi de tip statistic si anume:

A.     metoda seriilor paralele sau interdependente;

B.     metoda gruparilor;

C.    metoda tabelului de corelatie;

D.    metoda grafica.

A. Metoda seriilor paralele

Presupune scrierea in paralel a seriilor care reprezinta caracteristica presupus factoriala si caracteristica presupus rezultativa.

In functie de evolutia valorilor celor 2 serii, se poate deduce cu un anumit grad de certitudine daca intre cele 2 variante exista o legatura si ce fel de legatura ar putea exista.

B. Metoda gruparilor

Deja studiata, este o metoda calitativa surprinzand esenta fenomenelor.

In gruparea statistica se poate vedea caracterul legaturilor, directia lor, deoarece grupele sunt ordonate automat si se poate estima chiar intensitatea legaturii.

C. Tabelul de corelatie

Este un tabel cu dubla intrare, sinonim cu o forma speciala a gruparii combinate in care separarea pe grupe a unitatilor se face dupa variatia ambelor caracteristici (factoriala si rezultativa).

Valoarea caracteristicilor factoriale se trece in capul coloanelor in ordine descrescatoare, iar valoarea caracteristicilor rezultative se trece in capul liniilor in aceeasi ordine.

La intersectia dintre linii si coloane se trec frecventele absolute de aparitie.

In functie de modul in care se grupeaza aceste frecvente, se poate trage o concluzie referitoare la directia legaturii si forma ei.

x

xn xn-1 . . . . . . x2 , x1

ym

ym-1

y2

y1

fmn fm,n-1 0

fm-1,n-1

f22

f11

Astfel daca frecventele se grupeaza in jurul primei diagonale D1, legatura este inversa; iar daca se grupeaza in jurul diagonalei D2, legatura este directa.

D. Graficul de corelatie (numit si corelograma sau graficul norilor de puncte).

Este un grafic obisnuit format dintr-un sistem de axe rectangulare, caracteristica factoriala fiind trecuta pe axa absciselor si rezultativa pe axa ordonatelor.

Fiecare corespondenta intre x si y se numeste unitate si se reprezinta printr-un punct.

Daca punctele se distribuie aproximativ in jurul primei diagonale, atunci legatura este directa, iar daca se distribuie in jurul celei de-a doua, legatura estre inversa.

Distribuirea aproximativ uniforma in tot cadranul arata fie absenta legaturii, fie neconsistenta datelor.

Corelograma este cea mai apropiata de adevar dintre toate metodele elementare de caracterizare a legaturilor dintre variabile.

3. Metoda regresiei

Constituie o metoda statistica de cercetare a legaturilor dintre variabile cu ajutorul unor functii, denumite functii de regresie, adica cum se schimba variabila dependenta y in urma modificarii cu o unitate a variabilei independente x.

Daca notam cu y variabila dependenta si cu x1, x2, . variabilele independente vom obtine o ecuatie de regresie:

y = f(x1, x2, . )

Modelul teoretic se inlocuieste cu modelul de dependenta statistica:

Y = f(x1, x2, . ) + ε,

unde ε reprezinta eroarea aleatoare.

In functie de numarul factorilor (x1, x2, . , xn) deosebim: regresie unifactoriala (simpla) si regresie multifactoriala (multipla).

Modele de regresie unifactoriale

Cele mai cunoscute modele de regresie unifactoriale sunt:

a)     Modelul liniar

Este specific tipului de legatura dintre doua caracteristici care variaza in progresie aritmetica.

Daca consideram ca legatura dintre y si x este liniara rezulta ca:

y = α + β · x

unde: a si b sunt coeficienti (parametrii) ce vor fi calculati.

Parametrii a si b se estimeaza cu ajutorul unor metode specifice oferite de statistica, cum ar fi: metoda verosimilitatii maxime, metoda celor mai mici patrate etc. in practica se foloseste metoda celor mai mici patrate, care presupune ca suma patratelor abaterilor valorilor empirice (reale) y si valorile teoretice (ajustate) Y sa fie minima:

Prin derivare in raport cu a si b si anuland derivatele partiale obtinem sistemul de ecuatii normale:

unde n reprezinta numarul unitatilor observate.

Rezolvand sistemul se obtin coeficientii a si b.

Coeficientul a, poate lua atat valori pozitive cat si negative si reprezinta ordonata la origine, adica valoarea lui y cand x este nul.

Coeficientul b (coeficientul de regresie) arata masura in care se modifica caracteristica dependenta in cazul in care caracteristica independenta se modifica cu o unitate.

In cazul in care b<0, corelatia este inversa.

Daca b>0, corelatia este directa.

Daca b=0, variabilele x si y sunt independente.

In graficul de corelatie coeficientul b indica panta liniei drepte.

b)     Modelul exponential

Se utilizeaza in cazul in care variabila dependenta creste in progresie aritmetica, iar variabila independenta creste in progresie geometrica.

Prin logaritmare modelul devine liniar:

lg Y = lg a + x · lg b

Facand urmatoarele inlocuiri:

y' = lg Y; a' = lg a; b' = lg b

rezulta ecuatia unei drepte, respectiv:

y' = a' + b' · x

Procedand la rezolvarea sistemului ca si in cazul precedent rezulta coeficientii a' si b', pe baza carora prin antilogaritmare se obtin coeficientii a si b.

c)     Modelul teoretic al parabolei de gradul doi

Se utilizeaza pentru dependente care prezinta un punct de maxim (minim), ecuatia de regresie fiind de forma:

Y = a + bxi + cxi2 + ε

Determinarea celor trei parametrii ai ecuatiei de regresie de tip parabolic se face folosind metoda celor mai mici patrate, respectiv determinand minimul expresiei:

3.2. Modele de regresie multifactoriale

Intre fenomenele economico-sociale exista legaturi complexe, care se pot exprima cu ajutorul ecuatiei de regresie multipla:

Y = f(x1, x2, . , xp) + ε,

in care x1, x2, . , xp reprezinta caracteristicile independente, iar ε este o variabila reziduu, cu dispersia constanta si media nula.

Cel mai utilizat model de regresie multifactoriala este modelul liniar:

Y = α0 + α1x1 + α2x2 + . +αpxp,

unde: α0 reprezinta coeficientul care exprima influenta factorilor neinclusi in model, considerati cu actiune constanta;

αi , i = 1,2, . ,p sunt coeficienti de regresie multipla.

Calculul coeficientilor se face ca si in cazul modelelor de regresie unifactoriale.

4. Indicatori statistici ai corelatiei

Pentru calculul indicatorilor statistici ai corelatiei se folosesc metodele parametrice, pentru a masura intensitatea legaturilor de tip statistic dintre 2 sau mai multe variabile care urmeaza o lege de repartitie de tip normal sau asimptotic normal. Cea mai utilizata metoda este metoda corelatiei. Pentru explicarea acestei metode se porneste de la legatura dintre doua variabile corelate (x si y) , reprezentate in graficul de corelatie in jurul mediilor lor .

Se obtine astfel diagrama de corelatie alcatuita din 4 sectoare (cadrane), in fiecare din aceste cadrane, abaterile valorilor individuale fata de media lor avand semnificatii diferite dupa cum urmeaza:

-in cadranul I, dxi si dyi sunt pozitive;

-in cadranul II dxi pozitiva, dyi negativa;

-in cadranul III; (-,-):

-in cadranul IV (-,+).

Masurarea intensitatii legaturii se face cu ajutorul urmatorilor indicatori: covarianta, coeficientul de corelatie, raportul de corelatie.

a)     covarianta se noteaza: cov sau cov(x,y),; se obtine ca o medie aritmetica a produselor abaterilor variabilelor fata de media lor:

Semnul indicatorului arata directia legaturii, respectiv + pentru legatura directa si - pentru cea inversa. Covarianta poate fii nula, caz in care cele doua variabile sunt independente.

In cazul unei legaturi functionale liniare valoarea absoluta maxima a covariantei variabilelor x si y este: in general insa valoarea absoluta a covariantei nu are limita superioara.

b) coeficientii de corelatie liniara simpla

Coeficientul de corelatie liniara simpla (rxy) este un indicator care masoara numai intensitatea legaturii de tip liniar dintre doua variabile x si y. Se calculeaza ca o medie aritmetica a produsului abaterilor normale normate ale celor doua variabile.

Abaterile normate ale variabilelor x si y:

;

Rezulta urmatoare relatie de calcul:

In practica se utilizeaza relatia:

Cand intervin si frecventele relatia devine:

Coeficientul de corelatie liniara simpla satisface inegalitatile: -1 ≤ rxy ≤ 1 cu urmatoarea tipologie valorica:

daca rxy se apropie de -1, intre variabile exista o corelatie liniara, simpla, inversa si puternica;

daca rxy se apropie de 1, variabilele sunt direct si puternic corelate;

daca valoarea coeficientului este 1, in valoare absoluta, intre variabile exista o dependenta functionala

In practica, pe o scala de la [0,1], luand coeficientul in valoarea absoluta, de utilizeaza urmatoarele subintervale:

0 ≤ rxy ≤ 0,2 - situatie in care nu exista o legatura intre variabile;

o,2 < rxy < 0,5 - intre variabile exista o legatura slaba;

0,5 < rxy < 0,75 - legatura dintre variabile e de intensitate medie;

0,75 < rxy < 0,95 - legatura puternica intre cele doua variabile;

0,95 < rxy < 1 - legatura dintre variabile este determinista, functionala.

NOTA: in literatura de specialitate poate fii notat si ryx rxy= ryx

Indiferent de notatie, x se considera caracteristica factoriala, iar y caracteristica rezultativa.

c) raportul de corelatie

Raportul de corelatie denumit si coeficientul de corelatie Pearson, masoara atat intensitatea legaturilor liniare cat si curbilinii. Se defineste cu relatia:

Raportul de corelatie poate lua valori intre 0 si 1. cu cat valoarea raportului este apropiata de 1, cu atat legatura de corelatie este mai puternica si invers.

Pentru verificarea semnificatiei coeficientilor corelatiei simple si partiale se foloseste testul t:

unde n reprezinta volumul esantionului.

Aplicatia 1

Despre un esantion de unitati comerciale selectat intamplator si nerepetat si care reprezinta 10 % din numarul total al unitatilor, se cunosc datele:

Grupe de unitati comerciale dupa valoarea vanzarilor realizate

Numar unitati comerciale

Vanzari totale

TOTAL

Se cere: sa se caracterizeze si sa se masoare legatura dintre numarul de unitati comerciale dupa valoarea vanzarilor realizate si vanzarile totale folosind metode parametrice, astfel:

a)     sa se masoare intensitatea legaturii, prin:

metoda regresiei;

metoda raportului de corelatie;

metoda coeficientului de corelatie.

b)     verificati semnificatia indicatorului de corelatie, stiind ca

tα =0,05; n-2 = 308 = 1,967.

a)     Metoda regresiei

TOTAL

Functia de regresie este:

Rezolvam urmatorul sistem de ecuatii pentru calculul parametrilor a si b:

/ 83.482 b = -2.977.400

b = -36,0976

100 a + 2.406 (- 36,0976) = 55.800

a =

a = 1426,5082

yxi = 1426,5082 - 36,0976 xi

Parametrul "b" arata o corelatie inversa intre numarul de unitati comerciale dupa valoarea vanzarilor realizate si vanzarile totale, adica daca numarul de unitati comerciale creste cu o unitate atunci valoarea vanzarilor totale scade in medie cu 36, 0976 mil. lei.

Metoda raportului de corelatie

Metoda coeficientului de corelatie

Se observa ca , deci se apreciaza ca legatura dintre numarul de unitati comerciale si vanzarile totale este liniara si se considera ca poate fi utilizat fie , fie.

b)     pentru a verifica semnificatia lui se va folosi testul "t".

Deoarece 6,3511 > 1,967 se apreciaza ca indicatorul de corelatie este semnificativ.





Politica de confidentialitate





Copyright © 2024 - Toate drepturile rezervate

Statistica


Statistica






termeni
contact

adauga