Biologie	Chimie	Didactica	Fizica	Geografie	Informatica
	Istorie	Literatura	Matematica	Psihologie

Matematica

Index » educatie » Matematica
» Despre analiza de regresie

Despre analiza de regresie

Despre analiza de regresie

Activitatea desfasurata pentru obtinerea unui model statistic se numeste analiza de regresie. Scopul principal al acestei activitati este de a identifica relatia matematica dintre o variabila dependenta si una sau mai multe variabile independente. O data identificata, aceasta relatie se poate utiliza la calculul variabilei dependente in functie de valori cunoscute ale variabilelor independente. Etapele principale ale analizei de regresie sunt /11, 12/:

Listarea variabilelor care influenteaza fenomenul.

Propunerea formei matematice a modelului.

Obtinerea datelor experimentale.

Determinarea coeficientilor modelului.

Analiza calitatii modelului.

Daca modelul matematic nu trece testele de calitate se reia activitatea de la punctul 1, daca se constata ca s-au omis variabile care pot influenta procesul si de la punctul 2, daca se constata ca forma modelului propus nu este corespunzatoare.

In cazul in care se coreleaza date experimentale care descriu un fenomen cunoscut, cazul cel mai des intalnit in activitatea din laborator, analiza de regresie incepe cu etapa a doua sau chiar a treia.

In continuare se vor prezenta principalele activitati desfasurate in cadrul fiecarei etape.

Este o etapa importanta, deoarece eventualele greseli in formularea ei pot compromite intreaga activitate. Se realizeaza pe baza informatiilor culese din literatura de specialitate, prin analogie cu alte fenomene sau pe baza experientei proprii. Se vor lista numai variabilele semnificative.

Alegerea formei modelului impune stabilirea numarului de ecuatii independente si formei acestora. Pe langa sursele prezentate la punctul 1, se poate utiliza teorema p. Daca se urmareste corelarea unor date experimentale alcatuite dintr-o variabila independenta si una dependenta intr-un model matematic, forma acestuia se poate stabili prin compararea curbelor obtinute prin reprezentarea grafica a datelor experimentale cu reprezentarile unor functii matematice tip prezentate in tabelul 1 din anexa.

Se utilizeaza modele polinomiale de diferite grade:

polinom de gradul unu: (2.1)

polinom de gradul doi:

(2.2)

ecuatii produs care se pot liniariza prin logaritmare:

(2.3)

Aceste doua etape reprezinta "partea intelectuala" forte a activitatii de regresie si din acest motiv va depinde in mare parte de "gradul de educatie", flerul si experienta rezolvitorului.

Un caz particular il constituie modelele a caror variabile au caracter calitativ. De exemplu se urmareste sa se stabileasca care varianta este preferata de piata libera pentru stocarea reziduurilor menajere: in pungi de plastic sau in containere. Modelul matematic va corela cifra vanzarilor in functie de o variabila fictiva x, care va lua valoarea 1 pentru pungi de plastic si 0 pentru containere. Numarul variabilelor fictive este egal cu jumatate din numarul variabilelor calitative, daca numarul acestora este par si cu jumatate plus unu pentru un numar impar.

Obtinerea datelor experimentale reprezinta partea cea mai laborioasa a analizei de regresie. Pentru reducerea volumul de munca si costului activitatii se recomanda, atunci cand este posibil, sa se efectueze experientele in regim programat. Acest subiect este tratat in sectiunea 6 a lucrarii.

Calitatea datelor experimentale se apreciaza cu marimi statistice a caror utilizare este reglementata prin standarde; vor fi prezentate in sectiunea 7 a lucrarii. Acestea confirma trei conditii pe care trebuie sa le indeplineasca datele experimentale:

sa fie suficiente

sa acopere intreg domeniul de variatie al variabilelor

sa fie reproductibile

In cazul in care se urmareste obtinerea unei ecuatii de corelarea a unui set de date experimentale format dintr-o variabila independenta si una dependenta se impune examinarea graficului care reprezinta campul de distributie al celor doua marimi, pentru a aprecia daca intre acestea exista o dependenta oarecare. Se procedeaza astfel:

Daca perechile de valori y, x se situeaza pe o fasie care se poate asocia unei curbe determinata, se apreciaza ca intre marimile respective exista o relatie functionala - vezi figura 2.2.

Daca nu se poate depista o dependenta functionala stricta intre variabile - vezi figura 2.3, deoarece punctele campului de distributie sunt repartizate destul de dezordonat, dar se poate intrevedea o tendinta ca valorile lui y sa depinda de x, se poate afirma ca intre y si x exista o relatie corelationala.

Daca nu se poate depista nici o legatura intre y si x, campul de distributie se va prezenta in mod asemanator cu cel din figura 2.4.

Ultimele doua cazuri se trateaza in continuare astfel: se examineaza tabelele cu perechi de date experimentale (x_i, ) si (, y_i). Daca se ajunge la concluzia ca intre x si sau si y apare o relatie de dependenta, adica perechile de valori sunt uniform crescatoare sau descrescatoare, se poate aprecia ca intre x si y exista o dependenta corelationala. Cu alte cuvinte intre marimile aleatoare x si y exista o dependenta corelationala daca fiecarei marimi x ii corespunde o cantitate nedefinita de valori y, dar media aritmetica a valorilor lui depinde de valorile lui x.

Figura 2.2 - Set de date intre care este o relatie functionala

Figura 2.3 - Set de date intre care exista o relatie corelationala

Figura 2.4 - Set de date intre care nu exista nici o relatie corelationala /13/.

Figura 2.5 - Reprezentarea grafica din figura 4 in coordonate (x, )

Figura 2.6 - Reprezentarea grafica din figura 4 in coordonate (x, ) dupa eliminarea masuratorilor considerate anormale.

O problema dificila o constituie situatia in care mai multe modelele pot corela datele experimentale. In figura 2.7 este prezentat un exemplu in care datele experimentale pot fi corelate fie printr-un model liniar , fir printr-un model neliniar. "Concurenta" dintre aceste modele se solutioneaza in cazul prezentat in figura 2.7 prin inlocuirea Y cu (punctele incercuite). Se constata ca dependenta dintre variabile este neliniara.

In concluzie:

Dependenta corelationala se poate transforma in dependenta functionala, doar in cazul particular, in care prin reprezentare grafica punctele experimentale se aseza pe o curba, eventual pe o dreapta.

Dependenta corelationala se abate mai mult sau mai putin de la dependenta functionala, iar masura acestei abateri se poate determina pe cale numerica.

Figura 2.7 - Exemplu de confuzie intre un model liniar si unul neliniar de corelare a unui set de date experimentale /9/.

Pentru aprecierea cantitativa a gradului de corelatie al datelor experimentale se utilizeaza covarianta (x, y). Aceasta este o unitate de masura a gradului de legatura dintre doua variabile individuale si se defineste astfel:

(2.4)

S-a notat cu N numarul determinarilor experimentale.

Valoarea zero a covariantei arata ca variabilele procesului nu se coreleaza, iar valorile pozitive sau negative ale acesteia indica existenta unei corelatii. In cazul datelor experimentale prezentate in figura 2.4 covarianta este 1,69, valoare care confirma reprezentarea grafica din figura 2.5 si anume ca datele experimentale se pot corela printr-un model liniar.

Politica de confidentialitate

Matematica

Statistica

Jocul ca invatare in activitatile matematice

Matematici financiare si actuariale - test grila

Monotonia unei functii

Matricea Exponentiala

Metoda puterii

Aritmetica in inele

REPREZENTAREA SI PARCURGEREA GRAFURILOR OARECARE

GEOMETRIE ANALITICA IN PLAN

Masura volumelor

Multimi, functii, numere reale - probleme rezolvate