Analiza Discriminantă

Proiect
7/10 (1 vot)
Domeniu: Statistică
Conține 1 fișier: doc
Pagini : 36 în total
Cuvinte : 5481
Mărime: 265.02KB (arhivat)
Publicat de: Dionisie Mihailă
Puncte necesare: 8

Cuprins

  1. 1. Ce este si la ce se foloseste analiza discriminantului? 4
  2. Definire 4
  3. Conditii 4
  4. Clasificare 4
  5. Relatia analizei discriminantului cu regresia si ANOVA 5
  6. Modelul de analiza a discriminantului 5
  7. Statistici asociate cu analiza discriminantului 5
  8. Presupunerile (conditiile)si datele 6
  9. 2. Conducerea analizei discriminantului 7
  10. 3. Prezentarea bazei de date 8
  11. 4. Exemplul 1 12
  12. 5. Exemplul 2 Un model cu patru grupe 27

Extras din proiect

1. Ce este si la ce se foloseste analiza discriminantului?

Definire

Analiza discriminantului este o tehnica pentru a analiza care caracteristici diferentiaza membrii unui grup. Analiza discriminantului are doua întrebuintari majore: estimare si întelegere. În scopul estimarii, analiza discriminantului furnizeaza o metoda simpla cu ajutorul careia putem determina în care grup este cel mai probabil ca o observatie sa se încadreze. Decât sa calculati probabilitatea unei distributii normale multivariate puteti doar sa calculati un index(valoarea unei functii) si sa-l comparati cu o valoare cutoff (limita). De exemplu un student promoveaza anul daca combinatia ponderata a mediei, numarului de credite si numarului de restante se situeaza peste o anumita valoare, care este cutoff-ul.

Ponderile din index indica impactul variabilelor: de exemplu numarul de restante poate avea o influenta mai mare decât media examenelor promovate.

Totusi procedura analizei discriminantului poate fi folosita deasemeni pentru:

" identificarea variabilelor ce sunt mai folositoare la diferentierea grupurilor;

" daca un set de variabile are rezultate la fel de bune ca celelalte;

" care grupuri se aseamana cel mai mult

" care cazuri sunt outlieri

Conditii

Analizarea datelor prin folosirea discriminantului se poate efectua numai atunci când:

" criteriul sau variabila dependenta este categoriala

si

" predictorul sau variabilele independente sunt de natura interval

De exemplu variabila dependenta ar putea fi alegerea pentru o bautura racoritoare: Coca-Cola, Fanta sau Sprite, iar variabilele independente ar putea fi: evaluari are caracteristicilor sucului: continut de zahar: scazut, mediu, ridicat, aroma, aciditate, etc.

Clasificare

Analiza discriminantului este clasificata în functie de numarul de categorii pe care le are variabila criteriu: daca are 2 categorii atunci avem analiza discriminantului pe doua grupe, daca are 3 sau mai multe atunci este vorba despre analiza multipla a discriminatului.

Relatia analizei discriminantului cu regresia si ANOVA

ANOVA Regresie Analiza discriminantului

Similaritati

una

una

una

Nr. de variabile dependente

Nr. de variabile independente

multiple

multiple

multiple

Diferente

de interval

de interval

categoriala

Natura variabilei dependente

Natura variabilei dependente

categoriala

de interval

de interval

Modelul de analiza a discriminantului:

Modelul de analiza a discriminantului implica combinatii liniare de urmatoarea forma:

D=b0 +b1X1 + b2X2 + b3X3 +....+ bkXk

D=valoarea discriminantului

b=coeficientii discriminatului sau ponderi

X=predictor sau variabila independenta

Coeficintii sau ponderile sunt astfel estimate încât grupurile sa difere la valoarea functiei discriminantului cât de mult posibil. Acesta se întâmpla când raportul sumei de patrate intergrupe si când raportul sumei de patrate intragrupe are nivelul maxim. Orice alta combinatie liniara a predictorilor va rezulta într-o proportie mai mica.

Statistici asociate cu analiza discriminantului:

Urmatoarele sunt cele mai importante statistici asociate cu analiza discriminantului:

Canonical correlation - Corelatia canonica  masoara gradul de asociere dintre valorile discriminantului si grupuri. Este o masura a asocierii dintre functia simpla a discriminantului si setul de variabile binare care definesc încadrarea în grupuri.

Centroid- Centriodul este valoarea(valorile) medii ale scorurilor discriminantului pentru un grup particular. Exista atâtia centroizi câte grupuri sunt, pentru ca exista câte unul pentru fiecare grup. Mediile pentru un grup asupra tuturor functiilor sunt centroizi de grup.

Classification matrix  matricea de clasificare  mai este denumita confusion sau prediction matrix  matrice de estimare  contine numarul de cazuri ce sunt corect clasificate si cele gretit clasificate. Cazurile corect clasificate apar pe diagonala, deoarece grupele estimate(predictionate) si cele reale sunt aceleasi. Elementele ce nu se regasesc pe diagonala reprezinta cazuri care au fost incorect clasificate. Suma elementelor de pe diagonala împartita la numarul total de cazuri reprezinta hit ratio- rata încadrarilor corecte.

Preview document

Analiza Discriminantă - Pagina 1
Analiza Discriminantă - Pagina 2
Analiza Discriminantă - Pagina 3
Analiza Discriminantă - Pagina 4
Analiza Discriminantă - Pagina 5
Analiza Discriminantă - Pagina 6
Analiza Discriminantă - Pagina 7
Analiza Discriminantă - Pagina 8
Analiza Discriminantă - Pagina 9
Analiza Discriminantă - Pagina 10
Analiza Discriminantă - Pagina 11
Analiza Discriminantă - Pagina 12
Analiza Discriminantă - Pagina 13
Analiza Discriminantă - Pagina 14
Analiza Discriminantă - Pagina 15
Analiza Discriminantă - Pagina 16
Analiza Discriminantă - Pagina 17
Analiza Discriminantă - Pagina 18
Analiza Discriminantă - Pagina 19
Analiza Discriminantă - Pagina 20
Analiza Discriminantă - Pagina 21
Analiza Discriminantă - Pagina 22
Analiza Discriminantă - Pagina 23
Analiza Discriminantă - Pagina 24
Analiza Discriminantă - Pagina 25
Analiza Discriminantă - Pagina 26
Analiza Discriminantă - Pagina 27
Analiza Discriminantă - Pagina 28
Analiza Discriminantă - Pagina 29
Analiza Discriminantă - Pagina 30
Analiza Discriminantă - Pagina 31
Analiza Discriminantă - Pagina 32
Analiza Discriminantă - Pagina 33
Analiza Discriminantă - Pagina 34

Conținut arhivă zip

  • Analiza Discriminanta.doc

Alții au mai descărcat și

Analiza statistică a seriilor cronologice

DEFINITIE: SERIA CRONOLOGICA este un sir ordonat de valori ale unei variabile aferente unor momente sau perioade de timp succesive. Exista...

Analiză Comparativă a Natalității în Județele Cluj și Iași

Cap.1 Prezentare generală a județelor Cluj și Iași 1.1. Județul Cluj Situându-se în nord-vestul României, județul Cluj este al 13-lea ca mărime...

Cercetare Asupra Vopselei Lavabile Superweiss

Düfa ROMÂNIA SRL este una dintre cele mai dinamice companii ce opereaza pe piata de lacuri si vopsele din România. Compania a fost fondata în anul...

Program de Reabilitare

Spitalul de Boli Infectioase „Sf.Cuvioasa Parascheva „ este situat in partea de nord a orasului Galati pe strada Traian nr.393 ,în cartierul numit...

Centralizarea și Analiza Datelor

Q1+Q2. La aceste intrebari filtru, nici unul dintre cei 1000 de respondenti nu a fost eliminat Valoarea modala (Mo – cea mai mare frecventa de...

Statistică Economică

Obiectul principal în evolutia repartitiei bidimensionale îl reprezinta determinarea legaturii statistice dintre aceste doua variabile. În orice...

Te-ar putea interesa și

Discriminarea pe Piața Forței de Muncă din România

INTRODUCERE Lucrarea de față dorește să analizeze fenomenul discriminării pe piața muncii în general și pe piața românească în particular. Astfel,...

Analiza Datelor

I. Introducere Cunoasterea stiintifica din orice domeniu de activitate umana presupune, indiferent de natura si specificul obiectivelor concrete...

Analiza Datelor

I. Analiza componentelor principale 1.1. Standardizarea datelor 1.2. Matricea de corelaţie 1.3. Vectorii şi valorile proprii 1.4. Reprezentarea...

Raport de Cercetare BRD

Rezumat Introductiv\aBRD Groupe Societe Generale doreste introducerea pe piata a unui nou tip de card VISA Electron care va avea numele CreditStud....

Analiza Discriminant

Obiective: -80% dintre colegi sa fie atenti la prezentarea temei noastre -90% sa stie sa defineasca conceptul de analiza de discriminant si sa...

Analiza multidimensională a datelor

I.Descrierea datelor Analiza datelor are ca obiectiv principal extragerea informatiei relevante , semnificative care este continuta in informatia...

Analiza datelor

Descriere set de date Am construit o baza de date folosind informatiile gasite pe http://www.worldbank.org/. Baza de date contine 89 de tari...

Analiza datelor

I.INTRODUCERE In cadrul acestui proiect vom face o analiza statistica multivariata pentru date reale din educatie. Analiza statistica...

Ai nevoie de altceva?