Korrelatsioonist räägitakse väga palju. Korrelatsioonidest räägitakse sageli ka avalikkuses ning see on üks enam kasutatud andmeanalüüsi metoodikaid, mida ka koolides esmaste analüüsimetoodikate all selgitatakse. Vaatame täpsemalt, kuidas korrelatsioonanalüüsi tulemusi tõlgendada.
Korrelatsioon ehk seos kahe numbrilise muutuja vahel
Lihtsal moel eesti keeles öelduna väljendab korrelatsioon seost. Reeglina mõõdetakse sellega seost kahe numbriliselt mõõdetava muutuja vahel. Kasutame siin näitena illustreerimiseks kaht numbrilist tunnust – kaalu ja pikkust. Seejuures on oluline, et mõlemad mõõdetavad tunnused moodustaksid mingi järjestuse. Nõnda, et tunnuse väärtus 5 oleks suurem kui 3 ning 3 omakorda suurem kui 1 jne. Korrelatsiooni ei saa kasutada nn nominaaltunnuste puhul, näiteks olukorras, kus andmestikus tähistavad numbrid erinevaid maakoondi, kus 1= Pärnumaa, 2= Jõgevamaa jne.
Korrelatsiooni väärtused vahemikus 0…1
Korrelatsioonanalüüsi tulemus on korrelatsioonikordaja (sageli tähistatakse tähega
p), mille väärtus jääb vahemikku nullist üheni. Lisaks võib vahemik olla ka negatiivse suunaga ehk vahemikus 0 … -1. Seega, kokkuvõttes jäävad analüüsi tulemused alati vahemikku -1 … 0 … 1.
Täielik seos = 1; olematu seos = 0
Kõige lihtsam on korrelatsioonikordaja väärtust selgitada ilmselt just äärmuste näitel. Täielikku korrelatsiooni ehk seost iseloomustab korrelatsioonikordaja väärtus 1 (või ka -1). Täielikku korrelatsiooni meie näite puhul näeme allolevalt jooniselt. Täieliku korrelatsiooni puhul muutuvad mõlemad tunnused täpselt ühes rütmis. Mida suurem on kaal, seda suurem on pikkus ning vastupidi. Seejuures kaasneb ühe tunnuse väärtuse muutumisega täpselt samaväärne teise tunnuse väärtuse muutus (vt joonis all).

Andmeanalüüs - täielik korrelatsioon
Täieliku korrelatsiooni puudumist iseloomustab korrelatsioonikordaja väärtus, mis läheneb nullile. Meie näite puhul tähendab see olukorda, kus kaalu muutumisel ei ole selget seost pikkuse muutumisel (või vastupidi). Seda iseloomustab allolev joonis.

Andmeanalüüs - olematu korrelatsioon
Korrelatsioonanalüüsi tõlgendamine päris elus
Päris elus leiame haruharva juhuseid, kus tunnustevahelised seosed on äärmuslikud, so väga lähedal kas täielikule seosele (
p=1) või olematule seosele (
p=0). Seose tugevuse hindamisel kasutatakse erinevaid vahemikke. Üldiselt võib hinnata, et võrdlemisi tugevaks seoseks võib päris elus pidada korrelatsioonikordajaid alates väärtusest 0.8, vahel ka juba 0.7. Võrdlemisi nõrgaks võib reeglina pidada aga seoseid 0.3 ja alla selle. Alljärgnevalt toome näitena joonised võrdlemisi tugevast (
p=0.8) ning võrdlemisi nõrgast (
p=0.3) seosest.

Andmeanalüüs - Tugev korrelatsioon

Andmeanalüüs - Nõrk korrelatsioon
Andmemasin tegeleb andmete analüüsi, andmetöötluse ning uuringukonsultatsioonide pakkumisega nii ettevõtetele kui eraisikutele. Vaata ka:
Sildid: andmeanalüüs, andmetöötlus, korrelatsioon, Seosed
See postitus tehti
2010-07-21 kell 03:27 ja on lahterdatud kategooriates Uuringukool.
Sa vöid jälgida vastuseid sellele postile RSS-i vahendusel: RSS.
Sa võid jätta oma teate, või teha tagasiviite (trackback) oma enda lehelt.