Extras din proiect
Analiza Cluster
Variabilele folosite in model:
Nume - Numele modelului
ID - ID-ul modelului
CC - Capacitatea cilindrica
Putere - Puterea maxima a motorului in CP
PutereRPM - Numarul de rotatii pe minut la care se atinge puterea maxima
Cuplu - Cuplul maxim al motorului in NM
CupluRPM - Numarul de rotatii pe minut la care se atinge cuplul maxim
Ampatament - Distanta intre axele osiilor (intre roti)
Lungime - Lungimea autovehiculului
Latime - Latimea autovehiculului
Inaltime - Inaltimea autovehiculului
Greutate - Greutatea declarata a autovehiculului calculata de producator cu sofer si combustibil
GreutateMaxima - Greutatea maxima admisa a autovehiculului
Acceleratie - Timpul de acceleratie de la 0 la 100 km/h masurat in secunde
VitezaMaxima - Viteza maxima a autovehiculului
Consum - Consumul de combustibil in litrii pe 100 km parcursi
Citirea datelor din fisier:
masini<-read.table("Date.csv",header=TRUE, sep=",")
masini
View(masini)
1. Reprezentarea grafica a tarilor in functie de doi dintre indicatori
plot (PUTERE~CUPLU, masini)
with(masini, text(PUTERE~CUPLU, labels=NUME, pos=4, cex=.7))
2. Se creeaza un dataframe cu variabile numerice
Y <- masini[,3:13]
rownames(Y, do.NULL = TRUE, prefix = "row")
rownames(Y)<- masini$NUME
View(Y)
3. Standardizam observatiile in vederea aplicarii analizei cluster
standardize <- function(x) {(x - mean(x))/sd(x)}
Y_std <-apply(Y,2,standardize)
4. Calculam distantele dintre obiecte
distance <- dist(as.matrix(Y_std))
fviz_dist(distance, gradient = list(low = "white", mid = "grey", high = "black"))
Preview document
Conținut arhivă zip
- Analiza cluster in R.docx