I. Obiectiv si sursa datelor 3 II. Statistici descriptive in R 5 III. Analizarea Componentelor Principale 11 Datele selectate initial sunt caracteristici tehnice ale autoturismelor. Acestea au unitati de masura diferite. De aceea, in continuare vom lucra pe datele standardizate: 11 1. Criteriul Kaiser 12 2. Criteriul Pantei 12 12 3. Criteriul Procentului de Variatie 13 IV. Analiza Cluster 19 Analiza cluster poate fi privita ca un instrument care are ca scop reducerea unor multimi de obiecte, sau chiar de variabile, la un numar mai restrans de entitati informationale, care sunt clasele sau clusterele. Totusi, desi analiza cluster, privita ca un ansamblu de metode si tehnici de clasificare a obiectelor, se aplica in spatiul variabilelor, utilizarile frecvente ale acestor tehnici de analiza se remarca pentru clasificarea obiectelor. 19 6.1. METODA WARD 20 a. VARIABILE STANDARDIZATE 20 In continuare am realizat matricea distantelor utilizand metoda WARD. In cadrul acesteia se pot observa valorile din partea inferioara, aceasta fi nd o matrice de distanta simetrica si nu are relevanta cu ce nod se incepe calculul pentru distanta. 20 20 Algoritmul Kmeans 30 Algoritmul Fuzzy C-means 33 V. Clasificare 35 a) Clasificatorul Naive Bayesian 36 b) Metoda celor mai apropiati vecini(KNN) 38 c) Masina cu suport vectorial 42 d) Arbori de decizie 44 VI. Retele neuronale 45
I. Obiectiv si sursa datelor Pentru realizarea acestui proiect am ales domeniul auto, mai exact compania Bayerische Motoren Werke(BMW), companie pentru care voi studia toate modelele de masini in functie de anul de fabricatie. Obiectivul proiectului meu este de a urmari ce modele sunt optime pentru clienti prin intermediul analizei unui set de caracteristici specifice. Datele selectate au fost preluate de pe diferite site-uri de specialitate, precum www.auto-data.net, www.press.bmwgroup.com, www.autovit.ro, www.bmw.ro, www.mobile.de, www.autoscout24.com, www.autozeitung.de, www.bmw-bavaria.ro. Astfel, printre caracteristicile tehnice studiate, se regasesc urmatoarele: 1. Model - denumirea fiecarui model studiat; 2. Manufacturing date - data de fabricatie a fiecarui model studiat; 3. Engine size - capacitatea motorului pe care o are fiecare model studiat; 4. No cylinders - numarul de cilindrii pentru fiecare model studiat; 5. Length - lungimea fiecarui model; 6. Width - latimea fiecarui model; 7. Weight - greutatea fiecarui model studiat; 8. Consumption - consumul de motorina/benzina in litri/km pentru fiecare model; 9. Max speed - viteza maxima pe care o poate atinge fiecare model studiat; 10. Acceleration - timpul in care fiecare model poate atinge viteza de 100 km/h. 11. Co2 emissions - cantitatea de dioxid de carbon emanata in aer pentru fiecare model studiat; 12. Price - pretul la care se gaseste pe piata fiecare model studiat. Prin intermediul programului Excel am structurat datele sub forma unui tabel pentru a le putea studia eficient, tabelul continand un numar de 64 de observatii , dupa cum urmeaza: Tabel.1- Date initiale II. Statistici descriptive in R Fig2. Summary In urma utilizarii comenzii summary deducem urmatoarele observatii: 1.Engine size: - Capacitatea motorului ia valori intre 1995 cm3 pentru modelele urmatoare: Series_1, Series_2_1, Series_2_GT_1, Series_3, Series_3_GT_1, Series_6_GT, X1, X1_1 si 2993 cm3 pentru modelele urmatoare: Series_4, Series_4_1, Series_5, Series_5_1, Series_5_GT, Series_5_GT_1, Series_6, Series_7, Series_7_1, Series_8, Series_8_1, X3, X4, X5, X6, X7_1, Alpina_XD3, Alpina_XD4. - Capacitatea medie a motorului pentru automobilele BMW este de 2588. - 50% dintre valorile selectate au o valoare mai mica de 2993 cm3, iar restul de 50% au o valoare egala cu 2993 cm3. 2. No cylinders: - Numarul de cilindrii minim este de 4 pentru modelele: Series_1, Series_1_1, Series_2, Series_2_1, Series_2_GT_1, Series_3, Series_3_GT_1, Series_6_GT, Series_6_GT_1, X1, X1_1, X3_1, Z4, in timp ce numarul maxim de cilindrii este de 6 pentru modelele : Series_3_1, Series_4, Series_4_1, Series_5, Series_5_1, Series_5_GT, Series_5_GT_1, Series_6, Series_7, Series_7_1, Series_8, Series_8_1, X3, X4, X5, X6, X7_1, Alpina_XD3, Alpina_XD4. - Numarul mediu de cilindrii este de 5.188. - 50% dintre modelele selectate au un numar de cilindrii mai mic de 6, in timp ce 50% din modelele selectate au un numar de 6 cilindrii.
Plătește în siguranță cu cardul și beneficiezi de garanția 200% din partea Proiecte.ro.
Simplu și rapid în doar 2 pași: completezi datele tale și plătești.