Capitolul 1. Introducere 3 Capitolul 2. Descrierea bazei de date și a variabilelor analizate 4 Capitolul 3. Analiza statistică univariată a datelor 7 3.1.Descrierea statistică a variabilelor calitative 7 3.2. Descrierea statistică a variabilelor cantitative 9 Capitolul 4. Estimarea și testarea statistică 13 4.1. Estimarea unei medii prin interval de încredere 13 4.1.1. Estimarea prin interval de încredere unei medii 13 4.1.2. Estimarea prin interval de încredere a diferenței dintre două medii: 13 4.2 Testarea statistică 14 4.2.1. Testarea normalității unei variabile 14 4.2.2. Testarea unei medii 15 4.2.3. Testarea unei proporții 16 4.2.4. Testarea diferenței dintre două medii și două (sau mai multe) proporții 17 4.2.5. Testarea asocierii dintre două variabile 20 4.2.6. Testare ANOVA 21 Capitolul 5. Analiza de regresie și corelație 23 5.1. Analiza de corelație 23 5.2. Analiza de regresie 25 5.2.1. Regresia liniară simplă 25 5.2.2. Regresie liniară multiplă 27 5.2.3. Regresia neliniară 30 5.3. Testarea ipotezelor clasice ale modelului de regresie 32 Capitolul 6. Concluzii 38 Bibliografie 39
Capitolul 1. Introducere Acest proiect analizează o bază de date prin intermediul programului de prelucrare de date SPSS. Baza de date analizată este health-costs.sav și este preluată din colecția de baze oferite de IBM.com. Baza de date urmărește nivelul costului sănătății în cazul persoanelor vârstnice și factorii de influență a acestuia. Baza de date acoperă un eșantion de 525 de respondenți situați în SUA în anul 2020. Capitolul următor prezintă variabilele analizate și descrie baza de date. Capitolul 3 are în prim plan o analiză univariată a datelor, iar capitolul4 dezvoltă estimarea și testarea statistică pe baza datelor . În final, capitolul 5 prezintă o analiză de regresie și corelație. Scopul proiectului este de a afla cât de mult este influențat costul sănătății de factori precum consumul de alcool, consumul de țigări si vârsta. Capitolul 2. Descrierea bazei de date și a variabilelor analizate Baza de date folosită este health-costs.sav și este preluată din colecția de baze oferite de IBM.com. Aceasta conține 525 înregistrări și 10 variabile. Proiectul se axează pe 5 variabile, trei numerice și două nenumerice. Variabile numerice: - Costs (“Total Health Care Costs Declared over 2020”) - variabilă scalară ce reprezintă costul total - Age (“Age at Survey Completion (Years) “) - variabilă scalară, reprezintă vârsta respondenților - Alco (“Average Consumption of Alcoholic Beverages per Week “) - variabilă scalară ce reprezintă consumul mediu de alcool pe săptămână Variabile nenumerice: - Sex (“Sex“) - variabiă nominală, ce reprezintă sexul persoanei astfel: 0- “Female“, 1- “Male“ - Cigs2 (“Smoker?“) - variabilă nominală, ce reprezintă statusul de fumător al persoanei și este definită astfel: 1-“Nonsmoker“, 2- “Average Smoker“, 3- “Heavy Smoker“. Pentru a afișa informații despre baza de date vom accesa următoarea cale de acces din SPSS: Fille/Display Data File Information/Working File.
- Cursul Pachete program statistică I, anul 2021-2022 - Seminarele Pachete program statistică I - www.IBM.com
Plătește în siguranță cu cardul și beneficiezi de garanția 200% din partea Proiecte.ro.
Simplu și rapid în doar 2 pași: completezi datele tale și plătești.