Sissejuhatus
Site: | TalTech Moodle |
Course: | MEM5250 Ökonomeetria |
Book: | Sissejuhatus |
Printed by: | Guest user |
Date: | Sunday, 29 September 2024, 5:16 AM |
Description
Kirjandus:
T. Paas, Sissejuhatus ökonomeetriasse, ptk 1-3.
A. Sauga, Statistika õpik majanduseriala üliõpilastele, ptk 6.1-6.4
D. N. Gujarati, D. C. Porter, Basic Econometrics, Introduction, A.7 Statistical Inference: Estimation
1. Mis on ökonomeetria
Ökonomeetria on teadus, mis on tekkinud kolme teaduse (majandusteadus, matemaatika ja statistika) piirimaile.
Kujunes välja XX saj 30-ndatel aastatel. Siis toimusid esimesed konverentsid ja hakkasid ilmuma esimesed ajakirjad, kus kasutati terminit ökonomeetria (econometrics).
Ökonomeetria tähendab majanduse mõõtmist:
econometrics = oikonomia (kr majandus) + metron (kr mõõt) = majanduse mõõtmine
Teoreetiline ökonomeetria (theoretical econometrics) tegeleb ökonomeetriliste meetodite arendamisega. Tuginetakse matemaatilisele statistikale.
Rakenduslik ökonomeetria (applied econometrics) kasutab teoreetilises ökonomeetrias arendatud meetodeid erinevate majandus- ja ärindusprotsesside ning nähtuste kirjeldamiseks. Rakendusliku ökonomeetria eesmärgiks on toetada
- majandusprotsesside paremat mõistmist;
- prognooside tegemist;
- majanduslike ja poliitiliste otsuste kujundamist.
- "Pensionivara sooline lõhe Euroopas: kahekümne riigi andmetel põhinev analüüs" Rõõm, T. ja Soosaar, O. (2020)
- „Kuidas ettevõtted kohanevad miinimumpalga tõusuga? – Uuringutulemused Kesk- ja Ida-Euroopast.“ Malk, L. et al. (2017).
- „Euroopa Liidu riikide viivislaenude prognoosimudelid.“ Staehr, K., Uusküla, L. (2017).
- „Eurole ülemineku mõju inflatsioonile Eestis
.“ Rõõm, T. ja Urke, K. (2014).
- Mikroökonomeetria (microeconometrics) - inimeste ja ettevõtete käitumise analüüs. Enamasti kasutatakse kas ristandmeid või paneelandmeid. Objektideks on isikud, majapidamised või ettevõtted.
- Makroökonomeetria (macroeconometrics) – agregeeritud andmed piirkondade, riikide, riigigruppide kohta. Kasutatakse nii ristandmeid, aegridu kui ka paneelandmeid.
- Aegridade ökonomeetria (time series econometrics) – aegridade modelleerimine, prognoosimine.
- Finantsökonomeetria (financial econometrics) - väärtpaberite ja valuutakursside mudelid. Kasutatakse peamiselt aegridu.
- Ruumiökonomeetria (spatial econometrics) - ruumiliste aspektide arvestamine teoreetilistes mudelites. Näiteks kõrvuti asetsevates regioonides võivad mõned näitajad olla seotud - esineb ruumiline autokorrelatsioon. Ruumiökonomeetriast võib lähemalt lugeda Egle Tafenau artikllist "Regionaal-majanduspoliitiliste otsuste informatsioonilisest toetamisest".
2. Ökonomeetriline uuring ja mudel
- Probleem. Majandusteoreetilise või ärialase probleemi verbaalne formuleerimine.
- Andmed. Andmete kogumine ja ettevalmistamine.
- Mudel. Ökonomeetrilise mudeli valik ja selle parameetrite hindamine.
- Analüüs. Mudeli testimine, parameetrite usaldatavuse kontrollimine.
- Rakendus. Järelduste tegemine, prognoosimine,
mudeli omaduste parandamine.
- Esiteks tuleb määrata, mis on resultaatnähtus ja mis on seda mõjutavad faktorid. Sellega teostatakse endogeensete (sõltuvate) ja eksogeensete (sõltumatute) muutujate valik.
- Järgnevalt püstitatakse hüpoteesid uuritavate objektide või nähtuste kohta. Ökonomeetrilise analüüsi käigus testitakse nende hüpoteeside paikapidavust.
-
Teoreetiline mudel võib olla ka varem püstitatud - ökonomeetriat kasutatakse teoreetilise mudeli kehtivuse kontrollimiseks.
- Näiteks õpikus A. Sauga "Statistika õpik majanduseriala üliõpilastele" on alapeatükis 9.22 võetud ette Cobb-Douglase tootmisfunktsioon ja rakendatud seda autotööstuse ettevõtetele.
Millega tuleb arvestada ökonomeetrilise mudeli valikul?
- Mis tüüpi on arvandmed?
-
ristandmed (cross-sectional);
-
aegread (time series);
-
paneelandmed (panel data).
- Mis tüüpi on funktsioontunnus (sõltuv tunnus)?
- pidev: kasutada lineaarset või mittelineaarset regressioonmudelit;
- piiratud väärtustega: kasutada logit, probit või tobit mudelit.
- Mudeli valik on tegevus, mille kohta ei saa anda kindlaid reegleid, eeskirju.
Ökonomeetrilise mudeli komponendid
-
Modelleeritavad näitajad: endogeenselt (sisemiselt) määratud ehk sõltuvad muutujad (Y). Väärtused määratakse mudeli siseselt.
-
Modelleeritavat nähtust mõjutavad näitajad: eksogeenselt (väliselt) määratud ehk sõltumatud, seletavad muutujad (X). Väärtused määratakse mudeli väliselt.
-
Statistiliste meetoditega hinnatavad mudeli parameetrid (β).
-
Juhuslik komponent ehk vealiige (u)
Ökonomeetrilise mudeli üldkuju: \({\bf{Y}} = f({\bf{X}},{\bf{\beta }},{\bf{u}})\)
Juhime tähelepanu, et tegemist on maatrikskujul esitatud mudeliga. Tähistused on rasvases kirjas, mis tähistab maatriksit või vektorit. Seega nii endogeenseid kui eksogeenseid tunnuseid võib üldjuhul olla mitu, samuti mudeli parameetreid.
Miks kasutatakse ökonomeetrias termineid endogeenne ja eksogeenne tunnus? Kas ei või rääkida lihtsalt sõltuvast ja sõltumatutest tunnustest? Ühe võrrandi korral võibki kasutada termineid sõltuv tunnus Y ja sõltumatud tunnused X. Kuid esineb ka mudeleid, kus on mitu võrrandit. Sellisel juhul võib üks tunnus Y1 olla ühes võrrandis vasakul pool võrdusmärki (sõltuv) ja teises võrrandis paremal pool võrdusmärki (sõltumatu). Seepärast kasutataksegi üldjuhul termineid eksogeenne tunnus (väärtused on määratud mudeli väliselt) ja endogeenne tunnus (väärtused on määratud mudeli siseselt).
Kui kõikide tunnuste arvväärtused erinevate objektide korral on antud, saame hinnata parameetrite β arvväärtused. Sellega on mudel hinnatud. Miks me räägime parameetrite "hindamisest", seda selgitame järgmises peatükis.
Ökonomeetriline mudel baseerub arvandmetel. Andmed saadakse kas primaarsel vaatlusel (antud uuringu jaoks korraldatud) või sekundaarsel vaatlusel (varem muudel eesmärkidel kogutud). Tüüpilised andmeallikad:
- riiklik või ametkondlik statistika, onlain andmebaasid (Eesti Statistikaamet, Eurostat, OECD jt);
- küsitlus;
- ettetevõtte andmed.
Ühe uuringu jaoks võib kasutada mitut erinevat andmeallikat. Andmed tuleb koondada ühte andmebaasi, viia sobivasse formaati, valida sobivad ühikud, vajadusel teisendada (nt logaritmida). Andmebaasi korraldamise käigus tuleb pöörata tähelepanu ka võimalike vigade leidmisele (registreerimisvead, tahtlikud vead). Vead tuleb kõrvaldada. Näiteks vigaste andmetega objektid eemaldada valimist.
Andmete ettevalmistamisel tuleb tähelepanu pöörata järmistele asjaoludele.
- Andmete valik
- Majandusteoreetilises mudelis on näiteks SKP.
- Eesti Statistikaameti andmebaasist tuleb võtta
- SKP jooksevhindades või SKP aheldatud väärtus?
- sesoonselt ja tööpäevade arvuga korrigeeritud või mitte?
- Ühikute teisendamine. Arvandmed ei tohi suurusjärkudelt väga palju erineda. Esiteks tekitab see arvutusvigu, sest arvuti arvutab ujuvkoma arvudega ja kui suurusjärgud on väga erinevad, on arvutustäpsus väiksem. Teiseks peaksid mudeli parameetrid tulema ühes ja samas suurusjärgus, mis lihtsustab mudeli esitamist ja tõlgendamist. Näiteks
- Algselt palk 12 000 eurot, SKP 20 000 000 000 eurot (aastas). Mõlemal on ühikuks euro.
- Teisendatud ühikud: palk 12 tuh eurot (ühik on tuh eurot), SKP 20 mld eurot (ühik on mld eurot).
- Andmebaasi lähevad arvud 12 ja 20.
- Logaritmimine
- Kasutatakse siis, kui mingi tunnuse väärtused varieeruvad objektide lõikes väga suures ulatuses ja nende jaotus on asümmeetriline.
- Vajalik mudelite lineariseerimisel, elastsuskordajate leidmisel.
- Kasutatakse naturaallogaritmi ln. NB! Paljudes inglisekeelsetes õpikutes ja publikatsioonides tähistab naturaalalogaritmi log.
3. Hinnangud ja nende omadused
Uuritav objekt on üldkogum, aga enamasti kasutatakse ökonomeetrias valimvaatlustel saadud andmeid. Seega andmebaasis on valimi andmed. Järeldusi soovime teha aga üldkogumi kohta. Üldkogumiks võib olla Eesti elanikkond, kelle kohta soovime informatsiooni ja teha järeldusi. Aga kasutada on meil valimi andmed. Näiteks Eesti elanike finantskirjaoskuse ehk rahatarkuse uuring 2019, mille viis läbi Turu-uuringute AS. Valim oli 1005 isikut vanuses 18–80 eluaastat.
Valimi parameetrite põhjal leitakse üldkogumi parameerite hinnangud.
Järgnevas interaktiivses demos saad moodustada juhuvalimeid ja veenduda, et erinevad juhuvalimid annavad erineva keskmise. Juhuvalimi keskmine on üldkogumi keskmise punkthinnang. Pildile klikkides laetakse alla demo fail, demo avamiseks peab arvutisse olema installeeritud Wolfram Player.Valim on juhuvalim, järelikult hinnang on juhuslik suurus.
Ökonomeetrilise mudeli hindamisel on samuti tegemist valimiga ning valimi põhjal leiame mudeli parameetrite hinnangud.
Olgu näiteks tegelik mudel . Valimvaatlusest saadud andmete põhjal leiame, et hinnang on ja hinnang on . Parameetrite hinnanguid tähistatakse tavaliselt katusega ^ eristamaks neid parameetrite tegelikest väärtustest ja rõhutamaks, et tegemist on hinnangutega.
Matemaatilise statistika üheks põhieesmärgiks on valimi andmeid kasutades hinnata mingit üldkogumi parameetrit või parameetrite hulka β.
- Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse.
- Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele.
- Intervallhinnang (interval estimate) on lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. Seda tõenäosust nimetatakse usaldatavuseks ning intervallhinnangut ka usaldusvahemikuks (confidence interval).
Eelnevates demodes oli tegemist üpris lihtsa statistiku hindamisega - hindasime kogumi keskväärtust ja selle hinnanguks oli valimi aritmeetiline keskmine. Aga kui tuleb hinnata mingeid muid parameetreid?
Hinnangfunktsioon (estimator) on reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks.
Ühe ja sama parameetri hindamiseks võib kasutada erinevaid hinnangfunktsioone. Mõned sobivad paremini, mõned halvemini. Järgnevalt vaatamegi, mille alusel valida sobivat hinnangfunktsiooni.
Üldkogumi keskväärtuse hindamiseks võib kasutada näiteks
- valimi aritmeetilist keskmist;
- valimi mediaani;
- valimi minimaalse ja maksimaalse elemendi aritmeetilist keskmist.
Ökonomeetrilise mudeli parameetrite hindamiseks on samuti mitmeid hinnangfunktsioone:
- harilik vähimruutude meetod (Ordinal Least Squares, OLS);
-
suurima tõepära meetod (Maximum Likelihood, ML);
- kaalutud vähimruutude meetod (Weighted Least Squares, WLS);
-
kaheastmeline vähimruutude meetod (Two-Stage Least Squares, 2SLS);
-
üldistatud vähimruutude meetod (Generalized Least Squares GLS).
Käesolevas kursuses kasutame põhiliselt harilikku vähimruutude meetodit OLS. Kursuse lõpus aegridade modelleerimisel on kasutusel ka suurima tõepära meetod ML ning paneelandmete korral üldistatud vähimruutude meetod GLS.
Milliseid näitajaid kasutatakse siis hinnangfunktsioonide iseloomustamiseks?
Hinnangu nihe (bias) võrdub parameetri hinnangu keskväärtuse
ning parameetri tegeliku väärtuse
vahega: .
Parameetri hinnang on nihketa (unbiased), kui
\(E[ \hat \theta ] = \theta\).
On selge, et kahest hinnangfunktsioonist on parem see, mis on nihketa. Järgmises demos on kogumi keskväärtuse hindamiseks kasutatud kaht erinevat hinnangfunktsiooni. Üks on nihketa ja teine nihkega.
Võib ju küsida, miks peaks kasutama kogumi keskväärtuse hindamiseks valimi geomeetrilist keskmist, on ju loomulik kasutada valimi aritmeetilist keskmist. Aga alati selline loogika ei tööta. Näiteks võib tuua kogumi dispersiooni hindamise. Kasutades valimi korral sama valemit, mida kasutatakse kogumi dispersiooni leidmisel, saame nihkega hinnangu. Seda võib näha järgmises demos.
Erinevate hinnangfunktsioonide omadusi ei analüüsita ainult arvutisimulatsioonide abil. Seda, kas mingi parameetri jaoks valitud hinnangfunktsioon on nihkega või nihketa, saab paljudel juhtudel uurida anlüütiliselt, kasutades matemaatilist statistikat. Sellisel juhul arvutisimulatsioonid lihtsalt illustreerivad ja kinnitavad teoreetilist analüüsi. Näiteks seda, et kogumi dispersiooni nihketa hinnanguks on valimi dispersioon \(s^2 = \frac {1}{n-1} \sum (x_i - \bar x ) ^2\), on näidatud A. Sauga "Statistika õpik majanduseriala üliõpilastele" lisas A.7. Valimi dispersiooni valemi tuletamine.
Aga nihketa hinnangfunktsioone võib olla mitmeid. Näiteks sümmeetrilise jaotuse korral on üldkogumi mediaani nihketa hinnanguteks nii valimi mediaan kui ka valimi aritmeetiline keskmine. Kas võib kasutada mõlemat või on üks neist siiski parem? Otsustamiseks
tuleks uurida järgmist demot. Mille poolest need hinnangfunktsioonid erinevad?
Järelikult teine näitaja, mille alusel hinnangfunktsioone võrrelda, on hinnangu efektiivsus, mis iseloomustab hinnangute hajuvust. Parameetri θ nihketa hinnang on efektiivsem kui nihketa hinnang , kui hinnangu dispersioon on väiksem kui hinnangu dispersioon:
\({{\rm var}} \left[ {{{\hat \theta }_1}} \right] < {{\rm var}} \left[ {{{\hat \theta }_2}} \right]\)
Efektiivne hinnang on vähima dispersiooniga hinnang kõigi nihketa hinnangute seas.
Hinnangu nihet ja efektiivsust võib illustreerida järgmise joonise abil, kus me püüame tabada märklaua keskpunkti, mis on parameetri tegelik väärtus. Neli märklauda kujutavad nelja erineva hinnangfunktsiooni kasutamist. Sinised punktid tähistavad kasutatava hinnangfunktsiooni abil saadud punkthinnanguid.
Kolmas hinnanguid iseloomustav näitaja on hinnangu mõjusus. Olgu meil valimi maht n ning selle põhjal saadud parameetri θ hinnang \(\hat \theta _n\). Hinnang \(\hat \theta _n\) on mõjus (consistent), kui ta koondub tõenäosuse järgi parameetri tegelikuks väärtuseks:
\( \lim \limits_{n \to \infty } \rm P \left( \left| \hat \theta _n - \theta \right| < \varepsilon \right) = 1\) iga \(\varepsilon >0\) korral.
See avaldis tähendab, et mõjusa hinnangu korral valimi mahu n kasvades tõenäosus P, et hinnangu ja parameetri tegeliku väärtuse erinevus oleks väiksem kui mistahes positiivne arv, läheneb ühele.
Hinnangu mõjusus on asümptootiline omadus, st see omadus avaldub valimi mahu lähenemisel lõpmatusele. Mõjusust tähistatakse tihti ka nii:
\( \rm{plim} \left( \hat \theta _n \right) = \theta \)
Tähistus plim tuleb terminist probability limit.
Hinnangu mõjusust demonstreerib järgmine demo, kus kogumi keskväärtuse hindamiseks on moodustatud üha suurema mahuga juhuvalimid ning on näha, et suuremate valimite korral hinnang läheneb tegelikule väärtusele.
Neljas hinnaguid iseloomustav näitaja on hinnangu asümptootiline jaotus. Asümptootiline jaotus näitab, millisele klassikalisele jaotusele läheneb hinnangu valimjaotus valimi mahu kasvamisel.
Hinnangu asümptootilist jaotust kasutatakse parameetrite usalduspiiride leidmisel, parameetrite testimisel. Hüpoteeside testimise korral leitakse sealt teststatistiku kriitilised väärtused ning olulisuse tõenäosus.
Viimane ja viies omadus on hinnangu asümptootiline efektiivsus. Mõjusat hinnangut nimetatakse asümptootiliselt efektiivseks (asymptotically efficient), kui selle asümptootilise jaotuse dispersioon on väiksem suvalise mõjusa asümptootiliselt normaaljaotusega hinnangu dispersioonist. Asümptootiline efektiivsus erineb eespool vaadeldud efektiivsusest lõpliku valimi korral selle poolest, et see omadus eksisteerib valimi mahu lähenemisel lõpmatusele. Asümptootiliselt efektiivsed on näiteks mõningad suurima tõepära meetodil leitud hinnangud.
Hinnangute omadused kokkuvõtlikult
- Lõplike valimite korral (small-sample properties).
- Nihe. Iseloomustab süstemaatilist viga.
- Efektiivsus. Iseloomustab hinnangute hajuvust.
- Asümptootilised omadused, suurte valimite korral (large-sample properties).
- Mõjusus. Iseloomustab koondumist suurte valimite korral.
- Asümptootiline jaotus.
- Asümptootiline efektiivsus.