Home - Rasfoiesc.com
Educatie Sanatate Inginerie Business Familie Hobby Legal
Doar rabdarea si perseverenta in invatare aduce rezultate bune.stiinta, numere naturale, teoreme, multimi, calcule, ecuatii, sisteme




Biologie Chimie Didactica Fizica Geografie Informatica
Istorie Literatura Matematica Psihologie

Statistica


Index » educatie » » matematica » Statistica
» Introducere in pachetul statistic pentru stiintele sociale


Introducere in pachetul statistic pentru stiintele sociale


Introducere in PACHETUL STATISTIC PENTRU STIINTELE SOCIALE

1.1. Procesul de analiza statistica a datelor in PACHETUL STATISTIC PENTRU STIINTELE SOCIALE

In principal, PACHETUL STATISTIC PENTRU STIINTELE SOCIALE a fost conceput pentru ajuta utilizatorul in ducerea la capat a unei cercetari. Desigur, in procesul cercetarii analiza statistica intervine mult mai tarziu. Inainte de a ne aseza in fata unui calculator si a folosi Editorul de date (modulul Data Editor) al PACHETUL STATISTIC PENTRU STIINTELE SOCIALE pentru a introduce datele, se presupune ca am parcurs deja pasi importanti in procesul unei cercetari. Principalele faze ale unei cercetari sunt schitate in Figura 1.1.

Computerul si pachetul de programe PACHETUL STATISTIC PENTRU STIINTELE SOCIALE intervine doar in partea de analiza a datelor. In fata calculatorului activitatea se desfasoara practic in patru pasi care, de obicei, se reiau de mai multe ori (vezi figura 1.2).



Pasul care ne intereseaza in prima faza este cel de introducere a datelor intr-un fisier de date sau, dupa caz, de aducere a datelor in memoria interna.

Aducerea datelor in memoria interna

Pas 1

Selectarea unei proceduri

Pas 2

Selectarea variabilelor

Pas 3

Transformari

fisier de date

Interpretarea rezultatelor

Pas 4

Figura 1.2. Procesul de analiza a datelor

Aducerea datelor in memoria interna

Datele de gestionat (sau, dupa caz, de analizat) pot fi date salvate anterior intr-un fisier de date PACHETUL STATISTIC PENTRU STIINTELE SOCIALE.

Se pot citi date din fisiere proprii altor produse software. Cele mai cunoscute sunt bazele de date dBASE, FoxPro sau Access; fisierele tip foaie de calcul produse cu tabelatorul Excel; sau fisiere simple de tip text ASCII, produse cu orice editoare de texte. Desigur, pentru a "importa" astfel de date, trebuie respectate niste reguli clare si trebuie furnizate informatii suplimentare de conversie, in cadrul procedurilor initiate de PACHETUL STATISTIC PENTRU STIINTELE SOCIALE.

Se pot introduce direct datele in formatul propriu fisierelor de date PACHETUL STATISTIC PENTRU STIINTELE SOCIALE cu ajutorul modulului Data Editor.

Selectarea unei proceduri

Sistemul de meniuri al PACHETUL STATISTIC PENTRU STIINTELE SOCIALE ofera o gama de comenzi care permit selectarea si declansarea a patru categorii de proceduri:



Proceduri de gestionare a datelor

Proceduri de obtinere a listelor si rapoartelor

Proceduri de construire a tabelelor statistice, de calcul a unor indicatori statistici, de cautare a unor modele explicative

Proceduri pentru crearea unor grafice

Selectarea variabilelor

Cele mai multe din procedurile PACHETUL STATISTIC PENTRU STIINTELE SOCIALE cer precizarea variabilelor. Acestea sunt listate in casetele de dialog ale procedurilor, iar utilizatorul va trebui sa indice variabilele care intra in analiza.

Interpretarea rezultatelor

Dupa ce toate elementele de informatii necesare executiei unei proceduri au fost precizate de catre utilizator, procedura se va declansa si va produce rezultatele. Ele trebuie privite cu atentie si interpretate.

O sedinta de lucru cu PACHETUL STATISTIC PENTRU STIINTELE SOCIALE consta in mai multe reluari a celor patru faze: in mai multe operatiuni de management al datelor, sau mai multe proceduri de analiza a datelor. De multe ori ceea ce hotaram sa facem in continuare depinde de rezultatele unei operatiuni anterioare. Utilizatorul (sau dupa caz, cercetatorul) foloseste PACHETUL STATISTIC PENTRU STIINTELE SOCIALE ca un asistent docil, dar foarte puternic si capabil, ale carui performante depind de abilitatea cercetatorului de a lua deciziile cele mai potrivite.

PACHETUL STATISTIC PENTRU STIINTELE SOCIALE sub Windows functioneaza sub controlul unui mediu grafic GUI (Graphical User Interface), utilizand un sistem de meniuri descriptive si casete de dialog care usureaza mult interfata om-calculator. Cele mai multe operatiuni sunt declansate si duse la capat prin punctare si clic cu mouse-ul, chiar daca lucrul cu tastatura este oricand o a doua alternativa.

Module si ferestre PACHETUL STATISTIC PENTRU STIINTELE SOCIALE

Ca orice produs sub Windows, PACHETUL STATISTIC PENTRU STIINTELE SOCIALE se porneste prin dublu-clic pe pictograma sa aflata fie pe ecranul dispay-ului, fie in lista de Programe al meniului Start.

Ceea ce vom vedea prima data va fi modulul Data Editor (vezi figura 1.2). In afara acestui modul, PACHETUL STATISTIC PENTRU STIINTELE SOCIALE mai are inca doua: modulul Output Navigator - modul care se ocupa de afisarea rezultatelor prelucrarilor, precum si de modificarea aspectului lor - si modulul Chart Editor - modul care faciliteaza manipularea si gestionarea graficelor obtinute prin PACHETUL STATISTIC PENTRU STIINTELE SOCIALE.


Figura 1.2.    Ferestrele Data Editor si Output Navigator

Fiecare fereastra are o linie de titlu. Sub ea se gaseste meniul principal al aplicatiei. Fereastra Editorului de date contine datele de analizat sub forma unui tabel asemanator unei foi de calcul, iar orice rezultat produs de o procedura PACHETUL STATISTIC PENTRU STIINTELE SOCIALE se va introduce in fereastra Output al Navigatorului de rezultate. Initial se va deschide doar fereastra Editorului de date. Fereastra Navigatorului de rezultate se deschide indata ce vreo procedura produce rezultate. In afara acestor doua ferestre mai pot apare, la nevoie, alte doua ferestre: fereastra Editorului de grafice sau fereastra Sintax (pentru pastrarea comenzilor PACHETUL STATISTIC PENTRU STIINTELE SOCIALE in vederea repetarii lor intr-o alta sedinta de lucru).

Sistemul de meniuri

PACHETUL STATISTIC PENTRU STIINTELE SOCIALE v7.5 poate lucra intr-o varietate de moduri, dar majoritatea procedurilor pot fi accesate facand selectii din meniuri. Meniul principal al Editorului de date, cea mai utilizata componenta a pachetului, contine noua meniuri:

File. Se utilizeaza pentru a crea fisiere noi PACHETUL STATISTIC PENTRU STIINTELE SOCIALE, pentru a deschide fisiere existente, pentru a citi fisiere de tip spreadsheet sau baza de date create cu alte programe software. Meniul File se mai utilizeaza pentru crearea si deschiderea altor fisiere PACHETUL STATISTIC PENTRU STIINTELE SOCIALE, adica fisiere de grafice, de rezultate sau de sintaxa.

Edit. Se utilizeaza pentru a modifica sau copia texte din ferestrele de rezultate sau de sintaxa.

View. Se utilizeaza pentru a modifica aspectul ecranului in functie de optiunile utilizatorului.

Data. Se utilizeaza pentru a face schimbari globale la fisierul de date, cum ar fi agregarea datelor din mai multe fisiere, impartirea cazurilor in subseturi. Aceste schimbari sunt doar temporare si nu afecteaza fisierul permanent cu exceptia cazului cand se cere explicit acest lucru (prin salvare).

Transform. Se utilizeaza pentru a face schimbari variabilelor selectate din fisierul de date si pentru a calcula variabile noi pe baza valorilor existente in alte variabile. Nici aceste schimbari nu afecteaza fisierul permanent decat daca schimbarile se salveaza in mod explicit.

Statistics. Procedurile statistice se selecteaza din acest meniu. Cele mai comune proceduri statistice sunt: tabelele de frecvente, tabelele de asociere, calculul indicatorilor statistici descriptivi, analiza variantei, corelatia sau regresia liniara.

Graphs. Meniul Graphs se foloseste pentru a crea diagrame de bare, diagrame circulare, histograme, diagrame de imprastiere si alte grafice in culori si de mare rezolutie. Chiar si unele proceduri statistice pot genera grafice. Orice grafic poate fi imbunatatit cu ajutorul Editorului de grafice (Chart Editor).

Utilities. Se foloseste pentru a afisa informatii despre variabilele din structura fisierului de date, pentru a defini si utiliza seturi restranse de variabile, sau pentru a deschide un index al comenzilor PACHETUL STATISTIC PENTRU STIINTELE SOCIALE.

Window. Se utilizeaza pentru a aranja, a selecta si a controla atributele diverselor ferestre PACHETUL STATISTIC PENTRU STIINTELE SOCIALE.

Help. Acesta deschide ferestre de asistenta "on-line" cu manuale electronice, demonstratii, sfaturi contextuale si programe de invatare asistata de calculator de tip "tutorial".

Linia de pictograme

Cele mai comune comenzi PACHETUL STATISTIC PENTRU STIINTELE SOCIALE, folosite in mod uzual, pot fi accesate prin intermediul unor pictograme situate imediat sub linia de meniuri, in linia de pictograme (Tool Bar). Aceasta linie este prezenta la oricare din ferestrele modulelor PACHETUL STATISTIC PENTRU STIINTELE SOCIALE, dar poate contine pictograme diferite, adaptate situatiei (vezi figura 1.2).



Unele din pictograme s-ar putea intampla sa nu fie eligibile in anumite situatii chiar daca apar pe ecran. O scurta explicatie a ceea ce reprezinta ele poate fi obtinuta foarte simplu prin plasarea indicatorului mouse-ului pe ele.

Casetele de dialog

Cele mai multe proceduri PACHETUL STATISTIC PENTRU STIINTELE SOCIALE afiseaza casete de dialog prin intermediul carora aduna toate informatiile necesare ducerii la bun sfarsit a operatiunilor cerute de utilizator.

Pentru ca aceste casete ofera informatii utile in alegerile pe care utilizatorul le are de facut si pentru ca aceste casete sunt foarte asemanatoare intre ele, sa aruncam o privire, de exemplu, pe cea folosita la deschiderea unui fisier: figura 1.3

Aceasta caseta contine o zona etichetata Look in unde va apare directorul curent (BazeDate, in exemplu). Daca fisierul cautat nu este in directorul curent, acesta poate fi schimbat cu ajutorul pictogramelor din aceasta zona.

Fisierele sunt listate in zona cea mai intinsa a casetei de dialog. De exemplu, in figura 2.2 putem vedea patru fisiere. Oricare dintre ele poate fi deschisa. Alegerea se face prin pointare si clic pe butonul stang al mouse-ului.

Numele fisierului selectat va apare in zona File name. Aceasta informatie poate fi si tastata daca se doreste folosirea tastaturii si nu a mouse-ului.

Nu toate fisierele din directorul curent sunt listate in caseta. Ele sunt filtrate cu ajutorul extensiilor consacrate pentru diverse tipuri de fisiere. Observam ca in exemplu, toate cele trei fisiere au extensia .sav. Zona Files of type ofera insa posibilitatea selectarii altor tipuri inclusiv a tuturor tipurilor, deci posibilitatea neutilizarii filtrelor.


Figura 1.3. Caseta de dialog Open File

In partea dreapta jos a casetei se gasesc "butoanele", adica acele zone care declanseaza actiuni. Clic pe butonul Open produce deschiderea fisierului selectat. Clic pe butonul Paste produce doar un text cu comanda de deschidere a fisierului selectat, comanda ce se va scrie intr-un fisier de tip sintaxa, in vederea folosirii lui ulterioare. Butonul Cancel anuleaza operatiunea in curs, fara sa declanseze procedura pentru care se faceau pregatirile. Dupa actionarea butoanelor casetele de dialog dispar de pe ecran.

In majoritatea casetelor de dialog apare si butonul Reset. Selectarea lui va anula toate specificarile facute in caseta de dialog afisata, fara ca acesta sa fie stearsa de pe ecran. Utilizatorul va putea face deci alte selectii.

Unele casete de dialog pot contine "butoane radio" si / sau "casute pentru bifare" (check box). Ele nu declanseaza actiuni imediate dar permit optarea pentru anumite variante ale procedurilor. Butoanele radio se deosebesc de casutele pentru bifare prin faptul ca numai unul dintr-o zona poate fi ales si una din alegeri este obligatorie. In cazul casutelor pentru bifare, acestea pot fi bifate sau nu, indiferent cate sunt intr-o caseta de dialog. Butoanele radio au o aparenta circulara iar optiunea alesa se marcheaza cu un punct ( ). Casutele pentru bifare au aparenta patratica si optiunile alese vor fi marcate cu [

Asistenta "on-line"


Figura 1.4. Fereastra Tutorialului PACHETUL STATISTIC PENTRU STIINTELE SOCIALE

Meniul Help ofera multiple posibilitati de a obtine ajutor interactiv. Procedura Topics permite accesul in manualul electronic pe baza unor optiuni tematice, procedura Tutorial este indicata pentru un prin contact cu PACHETUL STATISTIC PENTRU STIINTELE SOCIALE (vezi figura 1.4), iar procedura Statistics coach este un meditator pentru procedurile statistice. Unele din proceduri contin demonstratii interactive, cele mai multe contin ilustratii si toate contin explicatii textuale in limba engleza.

Vom explora in cele ce urmeaza cateva din cele mai comune cai de a descrie datele dintr-o baza de date prin intermediul procedurilor de statistica elementara Frequencies si Descriptives. De foarte multe ori vom vedea ca aceste doua proceduri sunt suficiente pentru a raspunde la multe din intrebarile cercetarii. Procedurile Crosstabs si Means sunt utile in investigarea unor posibile relatii intre doua variabile. Aceste patru proceduri, la care se adauga si procedura Explore, nu sunt numai tehnici puternice descriptive, dar constituie tot atatea mijloace de investigatie necesare inaintea intreprinderii unor analize statistice mai sofisticate, de testare a ipotezelor.

1.1. Procedura Frequencies

Figura 1.1. Procedura Frequencies

Procedura Frequencies, furnizeaza tabele statistice si reprezentari grafice. Implicit, ea va genera o distributie de frecvente sub forma de tabel, in care pentru fiecare valoare distincta a variabilei selectate, se va afisa numarul de aparitii, procentul pe care acesta-l reprezinta din intregul esantion si procentul cumulativ. Ca optiuni, pot fi selectate grafice ca diagrama de bare, histograma (care vor fi alese in functie de tipul variabilei), valorile pentru anumite percentile sau indicatori statistici descriptivi.

In tabela de frecvente sau in diagramele de bare, valorile distincte pot fi ordonate in ordine crescatoare sau descrescatoare. Generarea / afisarea tabelei de frecvente poate fi eliminata daca variabila are prea multe valori distincte. Unitatile de masura folosite in diagrame si grafice pot fi sub forma de frecvente numerice (implicit) sau procente.


Indicatori statistici ce pot fi ceruti: media, mediana, modul, suma, abaterea standard, varianta, amplitudinea, minimum si maximum, eroarea standard a mediei, oblicitatea (skewness) si ascutimea (kurtosis) (cu erorile lor standard), cuartile si percentile definite de utilizator, frecvente, procente, procente cumulate.

Pentru declansarea procedurii se va alege din meniu: Statistics, Summarize, Frequencies

Figura 1.2. Procedura Crosstabs

1.2. Procedura Crosstabs

In cazul in care dorim sa studiem o relatie de asociere intre variabile categoriale, va fi utila o tabela care contine frecventele combinatiilor valorilor (categoriilor) celor doua variabile. Acestea sunt tot tabele de frecvente, dar se genereaza nu doar pentru o variabila, ci pentru combinatia a doua variabile. Vom numi o astfel de tabela, tabela de frecvente intre doua variabile, tabela de asociere sau tabela de contingenta. Ea se obtine din meniu, alegand:

Statistics, Summarize, Crosstabs .

Pentru exemplificare, vom utiliza fisierul Martie97.sav, care contine variabilele gen si mservici (satisfactia in munca).

Putem studia relatia intre mservici si venit, sau intre orice alte variabile intre care banuim ca ar putea exista o legatura.

Continutul celulelor asa cum apare sub forma de frecvente absolute (figura 1.3) nu exprima relatia dintre cele doua variabile. Pentru a putea compara diversele grupuri intre ele, trebuie sa folosim o masura independenta de numarul cazurilor cuprinse in grupul respectiv; fiecare grup avand un numar diferit de cazuri (359 persoane de sex masculin si 293 persoane de sex feminin). O exprimare in procente a frecventelor din fiecare celula permite comparatiile dorite (figura 1.4).

Figura 1.3. Tabel de asociere intre gen si satisfactia in munca (frecvente absolute)




Figura 1.4. Tabel de asociere intre gen si satisfactia in munca (frecvente procentuale)

Procentajul pe coloane ne arata distributia variabilei de pe linii pentru fiecare categorie a variabilei de pe coloane (ce procent din totalul cazurilor de pe o coloana este distribuit pe fiecare linie). Tabelul din figura 1.4 nu afiseaza astfel de procente.

Procentajul pe linii ne arata distributia variabilei de pe coloane pentru fiecare categorie a variabilei de pe linii (ce procent din totalul de cazuri de pe o linie este distribuit in fiecare coloana). In tabelul din figura 1.4 putem vedea, de exemplu, ca 8,9% din persoanele de sex masculin (variabila gen este variabila de pe linii) se declara deloc multumiti de serviciul pe care il au (variabila de pe coloane), 17% nu sunt prea multumiti, 52,9% sunt multumiti si 21,2% sunt foarte multumiti.

Observatie: Cum putem spune daca intr-un astfel de tabel procentele din celule reprezinta procentajul pe linii sau pe coloane? Daca in coloana numita Total procentul inscris in fiecare celula este 100%, avem de-a face cu procente pe linii. Daca pe linia numita Total procentul inscris in fiecare celula este 100%, avem de-a face cu procente pe coloane.

1.3. Procedura Descriptives

Aceasta procedura calculeaza si afiseaza indicatori statistici univariati (o variabila la un moment dat) pentru diferite variabile si poate calcula valorile standardizate (scoruri Z) pentru fiecare caz. Implicit, pentru fiecare variabila ce se selecteaza se vor calcula media, abaterea standard, minimum, maximum (vezi casutele bifate din caseta de dialog Descriptives Options din figura 1.5.). Optional mai pot fi cerute varianta, amplitudinea, eroarea standard a mediei, oblicitatea si ascutimea.

Observatie: Mediana, modul, cuartilele si percentilele nu pot fi calculate aici, ele se determina cu procedura Frequencies.


Figura 1.5. Procedura Descriptives

Declansarea procedurii se face din linia de meniu cu:

Statistics, Summarize, Descriptives

1.4. Procedura Means

Intr-un grup de subiecti putem distinge subgrupuri de cazuri in functie de diverse criterii, subgrupuri intre care este util sa facem comparatii in scopul stabilirii unor diferente ce merita exploatate mai indeaproape.

Putem studia de exemplu media notelor la matematica obtinute intr-o clasa, separat pentru fete si baieti. Sau putem studia diferentele privind media de varsta pentru femei si barbati intr-un esantion reprezentativ al populatiei Romaniei (vezi figura 1.6).

Subgrupurile pot fi formate atunci cand cazurile pot fi divizate pe baza uneia sau mai multor variabile de grupare.

Variabila sub studiu este deci de tip interval iar variabila de grupare este categoriala.

Declansarea procedurii se face prin intermediul liniei de meniu:

Statistics, Compare Means, Means

Rezultatul este o tabela care afiseaza pentru variabila in cauza media, abaterea standard si efectivul fiecarei categorii de grupare.

In cazul in care se doreste definirea grupurilor in functie de mai multe variabile de grupare, variabilele categoriale vor fi puse in "straturi" (Layers) diferite.


Figura 1.6. Procedura Means

1.5. Procedura Explore

Poate fi folosita pentru a studia distributia unei variabile:

Calculeaza indicatori statistici descriptivi pentru toate cazurile sau pentru subgrupuri de cazuri.

Identifica valorile extreme. Acestea se datoreaza uneori introducerii gresite a datelor in calculator. Daca sunt reale, atunci ele pot influenta puternic deciziile pentru analiza statistica ulterioara, de aceea este util sa fie depistate.

Calculeaza percentilele distributiei variabilei, atat pentru toate cazurile cat si pentru subgrupuri de cazuri;

Genereaza o varietate de reprezentari grafice a datelor (stem and leaf, boxplot, histograme) care ne arata vizual cum se distribuie valorile datelor.

Pentru declansare vom alege din linia de meniu:

Statistics, Summarize, Explore

In Dependent List se trece variabila pe care dorim s-o exploram (variabila tip interval). Variabila factor este o variabila de grupare, care se alege in cazul in care dorim sa calculam statistici pentru subgrupuri de cazuri ale variabilei numerice studiate.


Figura 1.7. Caseta de dialog al procedurii Explore


Fig.1.8. Grafic boxplot pentru legatura dintre satisfactia in munca si varsta (Martie97)

In figura 1.8 putem vedea o diagrama "boxplot" produsa de procedura Explore avand ca si variabila factor mservici (satisfactia in munca) iar ca variabila dependenta varsta. Caseta de dialog al procedurii Explore a fost completata ca in figura 1.7.







Politica de confidentialitate





Copyright © 2024 - Toate drepturile rezervate

Statistica


Statistica






termeni
contact

adauga