Ülesanne 1.3

Vastus: Ülesanne 1.3

Ako Sauga
Vastuste arv 0
Tere!
Korrelatsioonikordajaid saab leida vaid arvuliste ehk kvantatiivsete tunnuste vahel. Need, mis on mõõdetud intervallskaalas. Nii on ka ülesandes 3.7) öeldud, et leida korrelatsioonikordajad arvuliste tunnuste vahel. Arvudega on tegemist siis, kui on garanteeritud, et 4 on 2 korda suurem kui 2. Tunnused tootja (Acura, Audi, BMW jne) , mudel (Integra, Legend, 90, 100 jne), riik (USA, muu) ei ole arvulised tunnused. Need on kvalitatiivsed tunnused, antud nimiskaalas. Skaalade kohta vt minu Statistka õpik lk 17-20.
Ökonomeetriapakettide andmestikus esitatakse kvalitatiivsed tunnused numbriliste koodidena. Siin näiteks (vt Gretli menüüst Data -> Display string tables) on tootja kodeeritud järgmiselt

1 "Acura"
2 "Audi"
3 "BMW"
4 "Geo"
5 "Honda"
6 "Hyundai"
......
Siin 1, 2, 3,4 jne ei ole arvud vaid numbrilised koodid. Ei saa ju väita, et näiteks 6 Hyundai on kolm korda parem kui 2 Audi. Või mudelite kodeering
1 "Integra"
2 "Legend"
3 "90"
4 "100"
.......
Kas "100" on 2 korda parem kui "Legend"? Ei ole. Jälle on numbrilised koodid. Numbriliste koodidega mingeid tehteid teha ei saa. Tekstist ei saa ju leida aritmeetilist keskmist. Samuti ei saa leida korrelatsioonikordajaid, mille leidmine põhineb arvutustel. Samamoodi nagu näiteks oma pereliikmete telefoninumbritest ei leita aritmeetilist keskmist. Või näiteks korrelatsioonikordaja ettevõtte töötajate telefoninumbrite ja isikukoodide vahel? Kui need on andmebaasis olemas ja arvutile anda käsk, et leia korrelatsioonikordaja, siis ta seda ka teeb.
Sama  ka andmefaili autod korral. Kui panna need kvalitatiivsed tunnused Gretlis korrelatsioonimaatriksisse, siis kuna need on kodeeritud numbritega, arvutab küll programm korrelatsioonikordajad välja. Aga programm ei tea, et need on lihtsalt koodid, millega arvutusi ei tehta. Seda vahet peab nüüd tegema analüüsija: korrelatsioonimaatriksisse tohib lisada vaid arvulisi tunnuseid.
Tunnuste kodeerimise kohta loe ka minu Statistika õpik lk 27
Seega antud juhul tohib korrelatsioonimaatrikssse lisada vaid HIND, KM, SIL, MAHT ja HJ, sest need on intervallskaalas, arvulised tunnused.