Cuprins
- Obiective.3
- I. REGRESIA LINIARA .4
- Exemplul 1 : Regresia liniara simpla .7
- Exemplul 2 : Regresia liniara multipla.18
- Exemplul 3 : Variabila de selectie : metoda Backward.28
- Exemplul 4 : Metoda de selectie Stepwise.34
- II. CURBA DE ESTIMARE .38
- III. BIBLIOGRAFIE.44
Extras din proiect
I. REGRESIA LINIARA
Analiza de regresie este metoda statistica ce permite studierea si masurarea relatiei care exista intre doua sau mai multe variabile, precum si forma legaturii existente intre acestea.
Prin aceasta metoda se incearca, pe baza unui esantion sau pe intreaga populatie, sa se estimeze relatia matematica dintre doua sau mai multe variabile; sa se estimeze valorile unei variabile in functie de valorile altei variabile.
Analiza de regresie lucreaza numai cu valori cantitative scalare.
Variabilele dependente si independente trebuie sa fie cantitative.
In expresie generala, un model de regresie poate fi scris astfel:
Y = f(X1, X2 &..Xn) + µ
Unde:
§ Y variabila dependenta(rezultativa) aleatoare
§ X1, X2 &..Xn variabile independente(factoriale) nonaleatoare
§ µ variabila aleatoare eroare sau reziduu
Se pleaca de la cea mai simpla ecuatie ecuatia dreptei:
Norul de puncte este metoda de reprezentare grafica a regresiei. Prin aceasta metoda se poate intui foarte usor relatia dintre doua variabile, x si y, pentru un anumit esantion sau populatie.
Modelul statistic simplu de regresie mai poate fi scris si astfel:
Y = ²0 + ²1 X + µ
unde:
§ Y este variabila dependenta;
§ X este variabila independenta;
§ ²0 este ordonata la origine, arata valoarea variabilei y cand x=0;
§ ²1 este panta dreptei;
§ µ este eroarea aleatoare neobservabila.
Modelul de regresie cu doua sau mai multe variabile independente:
Y = ²0 + ²1 X1 + ²2 X2 + µ
Mai general, regresia liniara multipla se noteaza astfel:
Y = ²0 + ²1 X1 +&&&+ ²P XP + µ , cu p>2
Analiza de regresie foloseste in scopul:
" de a estima valorile unei variabile considerand valorile altei/altor variabile
" de a evalua in ce masura variabila dependenta poate fi explicata prin variabila independenta sau printr-un subset de variabile independente
" de a identifica care subset din mai multe variabile independente trebuiesc luate in calcul pentru estimarea variabilei dependente
Inainte de toate trebuie sa analizam variabilele dupa grafic, prin norul de puncte pentru a observa daca nu cumva putem aproxima legatura printr-o dreapta si sa identificam posibilele valori rebele care ar putea distorsiona rezultatul.
Pentru a testa si estima intervalele de incredere, se fac presupuneri:
- erorile se distribuie cu o medie egala cu 0
- erorile au o varianta constanta
- erorile sunt independente unele de altele
Analiza de regresie poate fi deformata de :
" necolinearitate
" puncte departate si
" prezenta subpopulatiilor
Baza de date cuprinde 45 de subiecti ce candideaza pentru un concurs de realizarea unei machete de piesa pentru masina. Baza de date cuprinde urmatoarele variabile: ore_lucr, ani_stud, exp_munc, varsta_a, duratatr, , greutate, inaltime, venituri si investit.
Patru exemple de regresie vor fi analizate in paginile urmatoare:
1. Regresia liniara simpla ’ modelul ales va prezice veniturile realizate de un concurent la realizarea proiectului in functie de banii investiti in proiect;
2. Regresia liniara multipla ’ variabilele independente din acest caz vor fi: duratatr, exp_munc si greutate
3. Variabila de selectie ’ metoda de eliminare Backward. Acest exemplu incepe cu un model ce cuprinde 8 variabile independente posibile si ilustreaza metoda de eliminare pas cu pas pana ce raman doar doua;
4. Variabila de selectie ’ metoda Stepwise. Acest exemplu incepe cu adaugarea pas cu pas a variabilelor in model. Variabilele deja intrate se testeaza pentru inlaturare, iar a doua varibila este ulterior adaugata.
Metode pentru determinarea variabilelor de selectie
- enter toate variabilele independente care se gasesc in campul de mai sus vor fi tratate ca un bloc comun de variabile si programul le va introduce ca atare in analiza;
- remove pentru a scoate variabilele din bloc intr-un singur pas;
- forward variabilele ce nu se gasesc inca in ecuatie sunt evaluate conform criteriului de excludere si sunt introduce in ecuatie una cate una;
- backward variabilele deja existente in ecuatie sunt excluse una cate una daca indeplinesc criteriul de excludere, pana cand nici o variabila din ecuatie nu mai satisface acest criteriu;
- stepwise fiecare bloc de variabile independente care nu este inclus inca in ecuatie este raportat la criteriul de selectie, apoi variabila este introdusa in ecuatie sau exclusa din model. Procedeul se repeata pana cand toate variabilele independente sunt incluse in model sau excluse.
Preview document
Conținut arhivă zip
- Regresia Liniara si Calcularea Curbei.doc