Analiza datelor

Proiect
7/10 (1 vot)
Domeniu: Cibernetică
Conține 1 fișier: docx
Pagini : 60 în total
Cuvinte : 2335
Mărime: 2.12MB (arhivat)
Publicat de: Ionelia P.
Puncte necesare: 9
Facultatea de Finante, Asigurari, Banci si Burse de Valori
Academia de Studii Economice, Bucuresti

Cuprins

  1. Introducere 3
  2. 1. Prezentarea datelor 5
  3. 1. Statistici descriptive 7
  4. 1.1. Media indicatorilor 8
  5. 1.2. Varianta indicatorilor 10
  6. 1.3. Deviația standard pentru indicatori 10
  7. 1.4. Skewness și kurtosis (simetria și platitudinea) 11
  8. 1.5. Histograma indicatorilor 12
  9. 1.6. Densitatea indicatorilor 15
  10. 1.7. Matricea de corelație 18
  11. 1.8. Matricea de covarianță 19
  12. 2. Analiza componentelor principale 21
  13. 2.1. Matricea vectorilor proprii 22
  14. 2.2. Standardizarea datelor 24
  15. 2.3. Criteriul lui Kaizer 26
  16. 3. Algoritmi de clusterizare 30
  17. 3.1. Clusterizare ierarhică 34
  18. 3.2. Algoritmul K-medoids 37
  19. 3.3. Algoritmul Fuzzy C-Means 42
  20. 4. Algoritmi de clasificare 44
  21. 4.1. Clasificatorul Naiv Bayesian 45
  22. 4.2. Metoda celor mai apropiați k vecini 50
  23. 4.3. Mașini cu suport vectorial (SVM) 53
  24. 5. Rețele neuronale 55

Extras din proiect

Introducere

Cunoașterea științifică din orice domeniu de activitate umană presupune, indiferent de natura și specificul obiectivelor concrete urmărite, o complexă și riguroasă analiză cantitativă a fenomenelor și proceselor care fac obiectul cercetării. Este vizibil pentru oricine, și din ce în ce mai mult, că în epoca modernă aproape orice individ angrenat într-o activitate umană se ocupă, într-un fel sau altul, în mod direct sau indirect, cu date și informații, cu colectarea, prelucrarea și interpretarea acestora.

Desfășurarea oricărei activități umane implică o producție continuă de date sau informații, care se acumulează în timp și care pot fi folosite pentru cunoașterea structurală și evolutivă a fenomenelor la care se referă aceste informații, în scopul fundamentării corecte și eficiente a deciziilor care trebuie luate. Mai mult decât atât, desfășurarea activităților umane nici măcar nu poate fi concepută în zilele noastre fără un consum continuu, din ce în ce mai mare, de informație. Din acest punct de vedere, se poate spune că informația a devenit unul dintre factorii de producție importanți și activi, un factor de progres și civilizație.

Totdeauna, mulțimile de date conțin, într-un mod amalgamat și invizibil, atât aspecte semnificative, cât și aspect nesemnificative, ale manifestării fenomenelor. Deoarece cunoașterea științifică vizează în mod exclusiv aspectele informaționale semnificative, apare necesitatea utilizării unor metode și tehnici specifice analizei datelor, cu ajutorul cărora informația semnificativă să poate fi detectată, separată de informația nesemnificativă și exprimată sub o formă clară și interpretabilă.

Metodele și tehnicile de analiză a datelor sunt cele mai adecvate instrumente utilizabile pentru identificarea unor structure cauzale, pentru decelarea unor tendințe și configurații specifice pe mulțimea datelor analizate și obținerea unor reprezentări simplificate ale informațiilor de mare complexitate. Utilitatea și eficientă utilizării metodelor și tehnicilor de analiză a datelor sunt maxime în situațiile în care informațiile supuse studiului sunt în cantități foarte mari. Din acest punct de vedere, domeniul economic poate fi considerat ca fiind un domeniu privilegiat. În cea mai mare parte a lor, metodele și tehnicile de analiză a datelor au natură multidimensională, astfel încât, comparativ cu metodele și tehnicile de analiză statistică descriptivă, ele permit și investigarea legăturilor și interdependențelor evidențiate la nivelul mulțimilor de date.

Materia primă utilizată în orice activitate de analiză a datelor este reprezentată de o colecție sau mulțime de date sau informații cantitative, referitoare la stările sau evoluțiile unei mulțimi de fenomene.

Din punct de vedere al analizei datelor, orice mulțime de informații supusă studiului este privită ca fiind o reprezentare codificată, într-o formă mai mult sau mai puțin implicită, a unor aspecte informaționale referitoare la niveluri și variații ale unor fenomene, evoluții și tendințe relevante, legături și influențe semnificative, ierarhii și configurații structurale specifice.

Datele supuse unui proces de analiză nu evidențiază, în mod direct și explicit, prin ele însele, informația utilă și semnificativă. De regulă, datele conțin informația utilă și semnificativă sub o formă mascată, ascunsă, amestecată într-un mod nediferențiat și fără o logică aparentă, cu informația nesemnificativă, rezultată din influențe accidentale și marginale. În acest sens, se poate spune că la nivelul datelor primare supuse analizei, informația semnificativă se găsește sub o formă diluată și disipată într-o mulțime informațională complexă, neordonată și nestructurată după vreun criteriu logic existent aprioric.

Rolul analizei datelor este acela de a prelucra și filtra informațiile conținute în datele supuse studiului, cu scopul de a capta sau de a extrage esența informațională conținută în aceste date și de a evidenția această esența informațională într-o formă de reprezentare inteligibilă, sugestivă, simplificată și sintetizatoare. Atingerea acestui scop presupune realizarea unei succesiuni de transformări efectuate asupra datelor primare și implică utilizarea unor metode și tehnici specifice. Aceste transformări au scopul de a maximiza relevanța și interpretabilitatea datelor și presupun, printre altele, eliminarea informațiilor redundante sau lipsite de semnificație și generalitate, care au natură accidentală sau marginală. Din acest punct de vedere, procesul de analiză a datelor apare ca fiind un proces specific de transformare informațională, proces care are ca intrări datele primare, iar ca ieșiri informații sintetizatoare.

Lucrarea de față își propune să evalueze relevanța indicatorilor pentru conturarea unei imagini de ansamblu asupra țărilor surprinse în analiză si eliminarea redundanței informaționale.

1. Prezentarea datelor

În cadrul proiectului au fost supuse analizei 25 de țări din Europa cu atributele:

- x1- Productivitatea resurselor (Resource productivity) - variabilă cantitativă continuă

- x2- Rate de ocupare a lucratorilor in varsta (Employment rate of older workers%) - variabilă cantitativă continuă

- x3- Ani de viață sănătoasa-femei (Healthy life years - females) - variabilă cantitativă discretă

- x4- Emisiile de gaze cu efect de sera (Greenhouse gas emissions) - variabilă cantitativă continuă

- x5- Ponderea energiei regenerabile în consumul final brut de energie (Share of renewable energy in gross final energy consumption) - variabilă cantitativă continuă

- x6- Consumul de energie de transport în raport cu PIB (Energy consumption of transport relative to GDP)-variabilă cantitativă continuă

- x7- Asistența oficială pentru dezvoltare ca procent din venitul național brut (Official development assistance as share of gross national income) - variabilă cantitativă continuă

- x8- PIB-ul real pe capital, rata de creștere (Real GDP per capital, growth rate)- variabilă cantitativă continuă

- x9- Persoanele expuse riscului de sărăcie sau de excluziune socială % (People at-risk-of-poverty or social exclusion %) - variabilă cantitativă discretă

- x10- Rata de sinucidere, pe grupe de varstă - Total (Suicide death rate, by age group - Total) - variabilă cantitativă continua

Datele au fost preluate de pe Eurostat pentru anul 2016.

Preview document

Analiza datelor - Pagina 1
Analiza datelor - Pagina 2
Analiza datelor - Pagina 3
Analiza datelor - Pagina 4
Analiza datelor - Pagina 5
Analiza datelor - Pagina 6
Analiza datelor - Pagina 7
Analiza datelor - Pagina 8
Analiza datelor - Pagina 9
Analiza datelor - Pagina 10
Analiza datelor - Pagina 11
Analiza datelor - Pagina 12
Analiza datelor - Pagina 13
Analiza datelor - Pagina 14
Analiza datelor - Pagina 15
Analiza datelor - Pagina 16
Analiza datelor - Pagina 17
Analiza datelor - Pagina 18
Analiza datelor - Pagina 19
Analiza datelor - Pagina 20
Analiza datelor - Pagina 21
Analiza datelor - Pagina 22
Analiza datelor - Pagina 23
Analiza datelor - Pagina 24
Analiza datelor - Pagina 25
Analiza datelor - Pagina 26
Analiza datelor - Pagina 27
Analiza datelor - Pagina 28
Analiza datelor - Pagina 29
Analiza datelor - Pagina 30
Analiza datelor - Pagina 31
Analiza datelor - Pagina 32
Analiza datelor - Pagina 33
Analiza datelor - Pagina 34
Analiza datelor - Pagina 35
Analiza datelor - Pagina 36
Analiza datelor - Pagina 37
Analiza datelor - Pagina 38
Analiza datelor - Pagina 39
Analiza datelor - Pagina 40
Analiza datelor - Pagina 41
Analiza datelor - Pagina 42
Analiza datelor - Pagina 43
Analiza datelor - Pagina 44
Analiza datelor - Pagina 45
Analiza datelor - Pagina 46
Analiza datelor - Pagina 47
Analiza datelor - Pagina 48
Analiza datelor - Pagina 49
Analiza datelor - Pagina 50
Analiza datelor - Pagina 51
Analiza datelor - Pagina 52
Analiza datelor - Pagina 53
Analiza datelor - Pagina 54
Analiza datelor - Pagina 55
Analiza datelor - Pagina 56
Analiza datelor - Pagina 57
Analiza datelor - Pagina 58
Analiza datelor - Pagina 59
Analiza datelor - Pagina 60

Conținut arhivă zip

  • Analiza datelor.docx

Alții au mai descărcat și

Proiectarea sistemelor informatice

CAPITOLUL I. PREZENTAREA DOMENIULUI FIRMEI 1.1.Descrierea organizatiei 12 mai 1989 a devenit o zi semnificativa pentru piata Moldovei. In aceasta...

Tehnologia SSD-urilor

Un solid-state drive (expresie engleză cu traducerea liberă „unitate cu cipuri”; prescurtat SSD) este un dispozitiv de stocare a datelor care...

Cyber attacks - Analiza atacurilor informatice realizate prin e-mail

Abstract Datorită expansiunii internetului și a fluxului de date transmis online din ultimii ani, cele mai numeroase atacuri din secolul XX au...

Metoda Dijkstra

1) Fiecărui nod iÎV i s-a asociat o variabilă d(i) numită în continuare eticheta nodului i. Prin definiție d(s) = 0 . În oricare moment al...

România în mișcare

INTRODUCERE România în mișcare este un proiect care are scop evidențierea necesității sistemelor adaptive complexe în viața unui om. Având în...

BCE - Seminare 1-5

BCE Seminar 1 Sistemele dinamice discrete Clasificare: Un sistem dinamic discret este o secven.a de func.ii yt, care exprima valorile...

Proiectarea arhitecturii sistemelor informatice

Aspecte generale ale proiectării sistemelor informatice - Proiectarea sistemului informatic constă în stabilirea soluțiilor logice și specificarea...

Te-ar putea interesa și

Studiu de caz legislație europeană, siguranța alimentară - studiu de caz sucul biologic de mere

INTRODUCERE Într-o lume în care trăim într-un ritm amețitor, oamenii au început să fie din ce în ce mai preocupați de sănătatea lor și prin urmare...

Integrarea Copiilor cu Deficiențe Mintale Ușoare în Învățământul de Masă

INTRODUCERE Am decis să tratez şi să aprofundez această temă deoarece întotdeauna m-a sensibilizat să văd că unele persoane sunt marginalizată....

Analiza Veniturilor și Cheltuielilor Bugetare pentru Italia

PARTEA I 1.Analiza cheltuielilor bugetare A. Date absolute General government expenditure by function (COFOG) INDIC_NA Total general...

Funcții statistice în SQL - Studiu de caz analiza datelor privind jocurile olimpice

INTRODUCERE Într-o lume aflată în continuă schimbare, unde majoritatea domeniilor tind să fie din ce în ce mai informatizate, necesitatea stocării...

Buget și trezorerie publică - Slovenia

- După o analiza a datelor absolute putem observa evoluția cheltuielilor bugetare ale Sloveniei din 2000 pana in 2008, în milioane euro. De-a...

Cercetări de marketing Avon

Noua cremă Cellu – Sculpt din gama Avon Solutions 1.1 Istoric Avon AVON - 120 de ani de frumuseţe O poveste ce a început în urmă cu 120 de ani…...

Analiza Veniturilor și Cheltuielilor Bugetare pentru Belgia

BELGIA 1.PREZENTARE GENERALA : Situare geografica: Regatul Belgiei este o țară în Europa de Vest. Belgia este situată pe frontiera ce divide...

Studiu de caz privind opiniile studenților din cadrul facultății FABBV

Introducere Studiul de caz s-a efectuat pe un eşantion de 60 studenţi din anul III, forma de învăţământ zi. Chestionarul privind opiniile...

Ai nevoie de altceva?