Ülesanne 1.3

Ülesanne 1.3

by Kristjan Kitsing -
Number of replies: 2

Tere!

Tekkis küsimus ülesanne 1.3 7) küsimuse kohta. Kas pole Gretl programmis saadud maatriksi järgi veidike teised vastused?

a) Kõige tugevam korrelatsioon MUDEL ja TOOTJA vahel korrelatsiooni kordaja 0,9937 (absoluutväärtus kõige suurem).

b) Kõige nõrgemini seotud on MAHT ja TOOTJA, korrelatsiooni kordajaga 0,2204(absoluutväärtus kõige väiksem).

c) Kuna kriitiline kordaja on 0,2050, siis maatriksis on kordajaid, mille absoluutväärtus on väiksem kui kriitiline kordaja, st et kõik seosed ei ole statistiliselt olulised.

Kas olen õigesti aru saanud või on midagi jäänud kahe silma vahele? Lisan manuses ka pildi minu saadud korrelatsioonimaatriksist.


In reply to Kristjan Kitsing

Vastus: Ülesanne 1.3

by Kristjan Kitsing -
Parandan: b) Kõige nõrgemini seotud on MUDEL ja HJ, korrelatsiooni kordajaga -0,0087 (absoluutväärtus kõige väiksem).
In reply to Kristjan Kitsing

Vastus: Ülesanne 1.3

by Ako Sauga -
Tere!
Korrelatsioonikordajaid saab leida vaid arvuliste ehk kvantatiivsete tunnuste vahel. Need, mis on mõõdetud intervallskaalas. Nii on ka ülesandes 3.7) öeldud, et leida korrelatsioonikordajad arvuliste tunnuste vahel. Arvudega on tegemist siis, kui on garanteeritud, et 4 on 2 korda suurem kui 2. Tunnused tootja (Acura, Audi, BMW jne) , mudel (Integra, Legend, 90, 100 jne), riik (USA, muu) ei ole arvulised tunnused. Need on kvalitatiivsed tunnused, antud nimiskaalas. Skaalade kohta vt minu Statistka õpik lk 17-20.
Ökonomeetriapakettide andmestikus esitatakse kvalitatiivsed tunnused numbriliste koodidena. Siin näiteks (vt Gretli menüüst Data -> Display string tables) on tootja kodeeritud järgmiselt

1 "Acura"
2 "Audi"
3 "BMW"
4 "Geo"
5 "Honda"
6 "Hyundai"
......
Siin 1, 2, 3,4 jne ei ole arvud vaid numbrilised koodid. Ei saa ju väita, et näiteks 6 Hyundai on kolm korda parem kui 2 Audi. Või mudelite kodeering
1 "Integra"
2 "Legend"
3 "90"
4 "100"
.......
Kas "100" on 2 korda parem kui "Legend"? Ei ole. Jälle on numbrilised koodid. Numbriliste koodidega mingeid tehteid teha ei saa. Tekstist ei saa ju leida aritmeetilist keskmist. Samuti ei saa leida korrelatsioonikordajaid, mille leidmine põhineb arvutustel. Samamoodi nagu näiteks oma pereliikmete telefoninumbritest ei leita aritmeetilist keskmist. Või näiteks korrelatsioonikordaja ettevõtte töötajate telefoninumbrite ja isikukoodide vahel? Kui need on andmebaasis olemas ja arvutile anda käsk, et leia korrelatsioonikordaja, siis ta seda ka teeb.
Sama  ka andmefaili autod korral. Kui panna need kvalitatiivsed tunnused Gretlis korrelatsioonimaatriksisse, siis kuna need on kodeeritud numbritega, arvutab küll programm korrelatsioonikordajad välja. Aga programm ei tea, et need on lihtsalt koodid, millega arvutusi ei tehta. Seda vahet peab nüüd tegema analüüsija: korrelatsioonimaatriksisse tohib lisada vaid arvulisi tunnuseid.
Tunnuste kodeerimise kohta loe ka minu Statistika õpik lk 27
Seega antud juhul tohib korrelatsioonimaatrikssse lisada vaid HIND, KM, SIL, MAHT ja HJ, sest need on intervallskaalas, arvulised tunnused.