Eining, variabel og verdi

Innan statistisk analyse, er tre omgrep svært sentrale: eining, variabel og verdi. Opplegget freistar å skildra desse omgrepa på ein enkel måte.

Målet med samfunnsvitskapen er å gjera greie for og forklara ulike sider ved det samfunnet me lever i, til dømes:

Eitt av verkemidla er å samla inn og systematisera informasjon som er relevant for den aktuelle problemstillinga. Dersom ein til dømes er interessert i å finna ut korleis innvandrarane har det i Noreg, kan ein samla informasjonen inn på ulike måtar: Ein kan gje seg ut for å vera innvandrar for på denne måten sjølv å kjenna på kroppen korleis innvandrarane har det, ein kan intervjua ein del innvandrarar om deira røynsler, eller ein kan gjennomføra ei spørjeundersøking blant eit representativt utval av innvandrarane i Noreg.

I kvantitativ forsking, til dømes spørjeundersøkingar, samlar forskaren inn informasjon om mange einingar i den gruppa han er interessert i. Denne informasjonen blir systematisert og plassert i ei datamatrise. Til slutt nyttar forskarane kvantitative analyseteknikkar til å undersøkja datamaterialet.

Ei datamatrise er enkelt sagt ein tabell der kvar rekkje representerer ei eining, og kvar kolonne representerer eitt kjenneteikn ved desse einingane. Ei celle i tabellen gjev såleis den eksakte verdien for ei eining på ein variabel. Eit utdrag frå ei datamatrise med informasjon frå ei spørjeundersøking, kunne sett slik ut:

Tabell 1: Døme på datamatrise
IntervjunummerKjønn*Fødeårosb
1 1 1973  
2 0 1980  
3 1 1973  
osb      

*) 0 = Mann, 1 = Kvinne

Kvar rekkje i denne tabellen gjev informasjon om ein og same person: Respondent nummer ein er ei dame født i 1973. Informasjonen i kolonnane er ikkje den same for kvar respondent; somme er menn, andre er damer, og kolonnane blir difor kalla variablar.

Lær deg desse omgrepa med ei einaste gong!

Eining

Med einingar meiner me dei objekta datamaterialet inneheld informasjon om. Dersom me arbeider med meiningsmålingar, vil dette vera dei einskilde personane som har svart på spørjeskjemaet. Dersom me har samla inn informasjon om norske kommunar eller land i verda, vil dei geografiske områda, kommunar eller land, vera einingane i datamaterialet.

Variabel

Med variablar meiner me dei kjenneteikna eller opplysingane om einingane som datamaterialet inneheld informasjon om, til dømes dei einskilde spørsmåla i ei intervjuundersøking. Dersom einingane er land eller andre geografiske område, har me kanskje opplysingar om folketal osb.

Kategori/verdi

Kvar einskild variabel kan delast inn i kategoriar eller verdiar. I intervjudata vil dette vera dei einskilde svaralternativa til eit spørsmål. Dersom variabelen er folketal i ulike land, vil verdiane vera dei faktiske innbyggjartala i dei einskilde landa.

Meir om variablar

Det finst fleire typar variablar. Kvar variabeltype har bestemte logiske eigenskapar, og det bør ein ta omsyn til når ein analyserer.

Alle variablar er klassifiseringar. Dei deler einingane opp i grupper eller klassar. Kjønn deler til dømes folk inn i to grupper, kvinner og menn. Det er tilhøvet mellom desse gruppene som er avgjerande for kva variabeltype me står overfor.

Ikkje-metriske variablar

Dersom dei einskilde gruppene eller verdiane ikkje har noka naturleg rekkjefylgje eller rangering, er variabelen nominell. Verdiane er gjensidig utelukkande, men det finst ikkje reglar for rangering. Partipreferanse er ein slik variabel. Verdiane på denne variabelen er dei ulike partia, men det er ikkje råd å rangera desse. Ein kan ikkje seia at Høgre bør koma før Venstre, eller omvendt.

Den neste typen blir kalla ordinale variablar. På slike variablar er verdiane gjensidig utelukkande, og det er i tillegg råd å rangera dei. Til dømes er politisk interesse ein slik variabel. Det gjev meining å seia at ein som er ”svært politisk interessert” er meir politisk interessert enn ein som er ”litt interessert”. Det er likevel ikkje råd å seia noko meir om kor stor avstanden er mellom ”svært” og ”litt”, ein kan ikkje seia at interessa er dobbelt så stor eller tre gonger så stor. Jamvel om rekkjefylgja er naturleg, er det ikkje råd å måla avstanden mellom verdiane.

Nominelle og ordinale variablar har ein ting sams: Dei ulike verdiane er i utgangspunktet ikkje tal. Jamvel om me under dataregistreringa set inn talkodar i staden for dei eigentlege verdiane, seier ikkje desse tala i seg sjølv noko om innhaldet i verdiane. Tala er til for å handsama informasjonen meir effektivt. På grunn av dette er det heller ikkje råd å rekna med tala som om dei var vanlege tal. Det gjev ikkje meining å rekna ut gjennomsnittskjønnet i ei forsamling. Dei aller fleste er anten mann eller dame. For ordinale variablar nyttar me ei naturleg rekkjefylgje for å visa rangeringa, men det gjev ikkje meining å seia at ein som er ”svært politisk interessert”, med kode 4, er fire gonger så interessert som ein som ”ikkje er interessert”, kode 1. Samnemninga til nominelle og ordinale variablar er ”ikkje-metriske variablar”. Dei manglar dei aritmetiske eigenskapane til tala.

Metriske variablar

Metriske variablar måler storleikar, mengder, prosentdelar osb., og der måleskalaen byggjer på det vanlege talsystemet. Slike variablar har eit nullpunkt, og me kan seia at avstanden mellom verdien 1 og 2 er like stor som avstanden mellom 9 og 10. Talverdiane har ei direkte og intuitiv tyding, dei er ikkje surrogatkodar nytta i staden for dei reelle verdiane, slik situasjonen er for nominelle og ordinale variablar. Alder, inntekt, vekt og høgde er døme på metriske variablar.

Metriske variablar kan ein soleis rekna med. Verdiane føl naturleg etter kvarandre, og ein kan måla avstandane mellom verdiane. Ein kan seia at ein 10 åring er dobbelt så gammal som ein femåring, og ein kan seia at gjennomsnittsalderen i barnehagen er 3,2 år.