Beskrivande statistik används för att sammanfatta och presentera data på ett meningsfullt sätt utan att dra generella slumutsatser om en större population. Fokus vid beskrivande statistik ligger på att beskriva data som man samlat in från en enkät. Exempelvis kan beksrivande statsitik vara att man sammanfattar och presenterar datainsamlingen från en enkätundersökning om det gebomsnittliga betyget eller åldergruppen bland respondeneterna. det finns olika metoder slm anvönds vid beskrivande statistik. Exempelvis:
- Frekvenstabeller som används för att sammanställa data på ett lättöverskådligt sätt: Frekvenstabeller visar hur många gånger ett värde förekommer exempelvis hur många gånger det svarats nej respektive ja.
- Grafisk analys används för att visualisera data och kan bestå av stapeldiagram, histogram, cirkeldiagram etc.
- Centralmått tillhör den beskrivande statistiken och beskriver data genom att identifiera ett typiskt värde såsom: typvärde som är det värde som förekommer flest gånger, medelvärde som är summan av samtliga värden dividerat på antal värden samt median som är det mittersta värdet när datan är rangordnat i storleksordning.
Inferenteill statistik går steget längre än beskrivande statsitik och drar genrella slutsatser om en större population utifrån data från ett urval. Målet med inferentiell statistik är att kunna genralisera slutsatser från urvalet till hhrla populationen, vilket gör det till ett lämpligt verktyg för samhällsvetenskaplig forskning. Till skillnad från beskrivande statistik som inte drar generella slutsatser utan enbart beskriver data "så som den är" ämnar inferentiell statistik att svara på frågor om hela populationen med hjälp av data från ett representativt urval. Till exempel kan man använda data om effekten av en medicin hos patientgruppen och genrealisera slutsatserna om effekten i den stora gruppen.
- Population avser den grupp individer som gorskaren vill samla in data från. Exempel alla anställda inom malmö stad eller alla socionomstudenter i ett visst lärosäte.
- Urval avser den delmängd från populationen som man samlar in data från. För att resultatet från urvalet ska vara tillförlitliga och generaliserbara måste urvalet vara representativt vilket kan uppnås genom ett sannolikhetsurval.
- Statistisk signifikans är ett mått på om resultatet från datainsamlingen beror på slumpen eller från verkliga samband i populationen. För att avgöra om ett resultat är statistiskt signifikant används p-värdet.
- P-värdet används för att avgöra om ett resultat är statistisk signifikant. Om p-värdet är mindre än 0.05 är resultatet statistiskt sognifikant och nollhypotesen kan förkastas och mothypotesen (som säger att det finns ett samband) kan accepteras.
- Sannolikhetsurval är en urvalsteknik som innebär att slumpmässigt välja ut ett urval från den större populationen och sedan förutspå stt sannolikeheten för att alla deras svar tillsammans matchar svaren i hela populationen. Denna urvalsteknik är lämplig för att skapa ett representativt urval.
- Slupmässigt urval är en urvalsteknik som innebär att forskaren låter slumpen välja.
- Stratifierat urval är en urvalsteknik som innebär att man skapar småpopulationer genom att dela upp invånare utifrån exempelvis stadsdel och sedan gör slumpmässiga urval ur dessa småpopulationer.
- Totalurval innebär att forskaren väljer alla i den valda populationen exemeplvis studenter på socionomprogrammet, lämpligt med mindre populationer.
Bekvämlighetsurval innebär tt forskaren på grund av tidsbrist eller svårt med tillgång till populationen, tar det den kan få.
- Nominala variabler är kategoriska och går inte att rangordna. De inkodade sifforna kan enbart användas för att skilja olika svarsalternativ åt. Exemepl på nominalvariabler kan vara kön, bostadsort eller ögonfärg.
- Ordinala variabler är kategoriska och går att rangordna utifrån de inkodade siffrorna, däremot säger inte siffrorna något om avståndet mellan svarsalternativen. Ordinala variabler kan vara utbildningssystem eller attitydfrågor (lite-ganska lite-ganska mycket-mycket)
- Intervallvariabler är numeriska och mäts alltid med siffror där de inkodade siffrorna visar avståndet mellan de olika svarsalternativen. Exempel på sådana variabler är temperatur eller födelseår.
- Kvotvariabler mäts också alltid med siffror och det finns en rangordning men har en absolut nollpunkt. Variabler av detta slag kan vara inkomst, längd etcetera.
- Dikotoma variabler är sådana variabler som enbart har två svarsalternativ.
Beroende variabel (y) är den variabel som ska förklaras vilket exempelvis kan vara ett fenomen såsom inkomst.
Oberoende variabel (x) är den variabel som ska förklara den oberoende variabeln. Exempel på en oberoende variabel kan vara utbildningsnivå för att förklara inkomstnivån.
Likert skala är en betygsskala som används för att mäta undersökningsdeltagares aittyder, åsikter, motivation med mera.
Univariat analys är en statistisk analysmetod som lämpar sog vid deskriptiva forskningsfrågor och som används för att analysera en enda variabel. Denna grundläggande metod används för att beskrivs fördelningen av en enda variabel och för att identifiera mönster. Genom univariat analys kan man se om observationerna är fördelade jämt över alla kategorier eller enbart konceteerade till ett fåtal.
- Frekvenstabeller är vanliga inom univariat analys och anvönds för att sammanställa data på ett lättöverskådligt sätt. Datan som framgår av en frekvenstabell visar huur många gånger ett visst värde förekommer. Exenpelvis kan en frekvenstabell visat hur många som svarat ja respektive nej.
- Grafisk analys använder stapeldiagram, histogram eller cirkeldoagram för att visualisera data. Stapeldigram används för att visa frekvensfördelningen för kategoriska variabler. Histogram annds för att beskriva frekvensfördelningen för numeriska variabler. Cirkeldogram används för att visa andelen observationer som tillhör olika kategorier.
- Centralmått tillhör den beskrivande statistiken och används för att identifiera ett typiskt värde. Ett centralt mått är typvärde som hänvisar till det värde som förekommer flest gånger. Medelvärde är summan av alla värden dividerat på antalet värden. Medianen är det mittersta värden i en storleksordnad rangordning.
Bivariat analys är en statistisk analysmetod som används för att undersöka sambandet mellan två variabler. Till skillnad fepn univsriat analys som enbart undersöker en variabel används bivariat analys för att undersöka hur två variabler relaterar till varandra. Det kan handla om samvariationen mellan två variabler, hur en variabel påverkar den andra eller om det finns en skillnad mellan två grupper om en viss variabel.
- Korstabell (kval kval) används för att analysera sambandet mellan två eller flera kategoriska vsriabler. Korstabeller är i grunden den gemensamma frekvensfördelningen av två variabler. En korstabell används för att exempwlvis undersöka sambandet mellan kön och vilket politiskt parti man tillhör.
- Korrelation (r) (kavnt kvant) används för att analysera smabandet mellan två numeriska variabler. Pearsons korrelationskoefficient (r) används för att mäta styrkan och riktningen på sambandet. Positiv korrelation innebär att båda variablerna ökar i samma riktning. Negativ relation innebär att ena variablern ökar och den andra minskar. Ingen korrelation innebär att det inte finns något samband och därav varken öksr eller mikskar någon av variablerna.
- T-test (kval kvant) är en metod som används för att jämföra två grupper alltså undersöka hur två grupper skiljer sig från varandra. T-test undersöker om skillnaden är statistiskt signifikant. Ett exempel kan vara att man undersöker skillnaderna i lön (numerisk variabel) mellan könen (kvalitativ variabel).
-Medelvärdesanalys är en metod som snvänds för att jämföra medelvärdet mellan två olika grupper. Exemeplvis lönen mellan könen eller betygen i två olika klasser. Här har vi både numerisk variabel i form av lön eller betyg och kategorisk variabel i from av kön eller klass.
Hypotesprövning innebär att man formulerar en nollhypotes (H0) som säger att det inte finns ett samband mellan variablerna. Man formulerar även en mothypotes (H1) som säger att det finns ett samband mellan variablerna. För att testa hypoteserna använder man ett statsitiskt test som ger ett p-värde. Om p-värdet visar sig vara mer än 5% (0,05) behåller man nollhypotesen men om p-cärdet visar sig vara mindre än 5% (0,05) så förkastar man nollhupotesen och accepterar mothypotesen. Ett värde som är mindre än 0.05 anses vara statsitiskt signifikant vilket indikerar på att det finns en sannolikhet attt samabnden inte beror på slumumpen utan finns i verkligheten.
- För att undersöka samband mellan två kategoriska variabler (kval kval) används korstabeller och chi-q2 test.
- Vid undersökning av samband mellan två numeriska variabler (kvan kvan) hänvisar till metoder såsom korrelationskoeeficient.
- För att undersöka sambandet mellan en kategorisk och en numerisk variabel (kval kvant) kan man använda t-test eller medelvärdesanalys.