Cuprins
- 1. DESCRIEREA INDICATORILOR .. 3
- 2. STATISTICI DESCRIPTIVE ... 4
- 3. ANALIZA COMPONENTELOR PRINCIPALE ... 10
- 3.1. Matricea de corelație 10
- 3.2. Standardizarea datelor .. 11
- 3.3. Analiza variabilelor .. 13
- 3.4. Stabilirea numărului de componente principale ... 15
- 3.5. Vectori și valori proprii 17
- 3.6. Matricea factor . 18
- 3.7. Reprezentarea noului spațiu 19
- 4. ANALIZA CLUSTER 20
- 4.1. Distanța euclidiană dintre regiuni 20
- 4.2. Metode ierarhice .. 22
- 4.3. Metoda k-means ... 24
- 4.4. Graficul claselor ... 26
- 5. ANALIZA FACTORIALĂ . 27
- 5.1. Testarea aplicabilității .. 27
- 5.2. Alegerea numărului de factori .. 28
- 5.3. Metoda Verosimilității Maxime ... 28
- 6. ANEXE ... 34
Extras din proiect
1. DESCRIEREA INDICATORILOR
Datele au fost preluate .i prelucrate de pe site-ul: https://ec.europa.eu/eurostat/web.
Exemplul prezentat de noi folose.te o selec.ie de variabilele care descriu aspecte ale regiunilor Uniunii Europene ce .in de educa.ie, pia.a muncii si rata .omajului.
Am utilizat date disponibile pentru n=201 regiuni europene la nivel NUTS 2 si p=13 variabile care reprezinta:
- X1- Popula.ia înregistrata la data de 1 ianuarie 2021 pentru fiecare regiune
- X2- Speran.a de via.a înregistrata la data de 1 ianuarie 2021 pentru fiecare regiune în procente
- X3- Popula.ia activa înregistrata la data de 1 ianuarie 2021 pentru fiecare regiune
- X4- Valoarea procentuala a tinerilor fara studii .i fara loc de munca înregistrata la data de 1 ianuarie 2021 pentru fiecare regiune
- X5- Procentul de abandon .colar înregistrat la data de 1 ianuarie 2021 pentru fiecare regiune
- X6- Valorea procentala a angaja.ilor în tehnologie înregistrata la data de 1 ianuarie 2021 pentru fiecare regiune
- X7- Rata mortalita.ii înregistrata la data de 1 ianuarie 2021 pentru fiecare regiune
- X8- Rata .omajului înregistrata la data de 1 ianuarie 2021 pentru fiecare regiune în procente
- X9- Rata ocuparii înregistrata la data de 1 ianuarie 2021 pentru fiecare regiune în procente
- X10- Vârsta medie a popula.iei înregistrata la data de 1 ianuarie 2021 pentru fiecare regiune
- X11- Numarul elevilor înscri.i în înva.amântul primar înregistrata la data de 1 ianuarie 2021 pentru fiecare regiune
- X12- Rata popula.iei 25-64 ani care a terminat înva.amântul superior înregistrata la data de 1 ianuarie 2021 pentru fiecare regiune în procente
- X13- Numarul studen.ilor înscri.i la programele de licen.a sau orice echivalent al acestora înregistrata la data de 1 ianuarie 2021 pentru fiecare regiune
2. STATISTICI DESCRIPTIVE
Figura 1. Statistici descriptive ale datelor ini.iale
- X1 ( Popula.ia înregistrata ) :
Numarul minim al popula.iei înregistrat în anul 2020 a fost 84085, fiind de aproximativ 146 de ori mai mic decât numarul maxim înregistrat .i anume 12291557. Media anuala a fost 1812265, iar mediana 1330333, diferen.a dintre ele fiind una mare .i anume 481932, adica datele sunt împra.tiate.
Observam ca prima cuartila se înregistreaza la 773450, la o diferen.a de 689365 de numarul minim al popula.iei, ceea ce reprezinta existen.a outlierilor.
- 25% dintre regiuni au popula.ia mai mica decât 773450.
- 50% dintre regiuni au popula.ia mai mare mare 1330333.
- 25% dintre regiuni au numarul popula.iei mai mare decât 2189138.
- X2 (Speran.a de via.a)
Valoarea procentuala minima înregistrata a speran.ei de via.a a fost de 72,1%, fiind cu aproximativ 12 % mai mica decât valoarea maxima înregistrata 84%. Media acestui indicator a fost 80,27 %, iar mediana a fost 81,6%, diferen.a dintre cele doua fiind una mica ( 1,33 % ), adica datele sunt concentrate în jurul mediei.
Observam ca prima cuartila se înregistreaza la 78,5 %, la o diferen.a procentuala de 6,4 % de procentul minim înregistrat, ceea ce reprezinta existen.a outlierilor.
- 25% dintre regiuni au rata speran.ei la viata sub 78,5 %.
- 50% dintre regiuni au rata sperantei la via.a peste 81,6 %.
- 25% dintre regiuni au rata speran.ei la via.a mai mare de 82,4%.
Preview document
Conținut arhivă zip
- Analiza Datelor.pdf