Harilik lineaarne regressioonmudel

8. Mudeli korrektne esitamine

Regressioonanalüüsi põhitulemuste esitamisel esitatakse

  • parameetrite hinnangud;
  • parameetrite standardvead;
  • determinatsioonikordaja R2;
  • valimi maht n.
Standardvead kirjutatakse sulgudes parameetrite hinnangute alla.

\(\begin{array}{l}y = \hat b\quad  + \quad \hat a\,\;x + u\quad \quad {R^2} = ...\\\;(se(b))\;\quad (se(a))\;\quad \quad n = ...\end{array}\)

Näitena elektrienergia tarbimise mudeli korrektne esitus, mis on saadud mudeli aruande põhjal.


\(\begin{array}{l}{y_i} = 274 + 1,68\,{x_i} + {u_i}\quad \quad {R^2} = 0,588\\\;\quad (147)\;(0,22)\quad \quad \quad \quad \;n = 42\end{array}\)
kus x on majapidamise sissetulek aastas (GBP) ja y elektrienergia tarbimine aastas (kWh).

Tingimata tuleb lisada kasutatud tähistuste seletused koos ühikutega. Kui me ei lisa tähistuste seletusi, pole mudelist mingit kasu, sest keegi ei saa sellest aru. Ja kui me ei lisa ühikuid, ka siis pole võimalik mudelit korrektselt tõlgendada. 

Tähele tuleb panna seda, et arvud ümardatakse sobivalt. Standardviga esitatakse kas kahe või kolme tüvenumbriga, parameetri hinnang ümardatakse vastavalt vea teise või kolmanda tüvenumbrini. Ülearuste numbrite esitamine on infomüra, sest kui näiteks  viga on juba sajalistes, siis pole mingit mõtet esitada kohti peale koma. Nendel kohtadel olevad numbrid pole niikuinii usaldusväärsed ja segavad. 

Nüüd oleme vaadanud läbi programmi Gretl regressioonmudeli aruandes esitatud kõige olulisemad näitajad.
Testi ennast, kas oskad mudeli aruandest leida vajalikud suurused.

Kasutades autotootja Audi AG 2014. aasta aruandest võetud andmeid aastate 2005 kuni 2014 kohta, on hinnatud kulufunktsiooni kujul C=aq+b+u, kus C on kulud miljardites eurodes ja q aastas toodetud autode arv tuhandetes ehk tootmismaht. Mudeli hindamise aruanne: