2. Hüpoteeside testimise põhialused

2.1. Nullhüpotees, sisukas hüpotees ja teststatistik

Hüpoteeside statistilisel testimisel tuleb alati formuleerida hüpoteeside paar: nullhüpotees ja sisukas hüpotees. Sõltuvalt testimise tulemusest võetakse siis vastu kas nullhüpotees või sisukas hüpotees. 

  • Nullhüpotees H0: miski võrdub millegagi (erinevus on null). Näiteks
    • kogumi keskväärtus μ=μ0
    • kogumi A keskväärtus võrdub kogumi B keskväärtusega, μAB
    • mudeli mingi parameeter on null, seos puudub: βi=0
  • Sisukas ehk alternatiivne hüpotees H1: võrdus ei kehti.

Hüpoteesipaar võib olla püstitatud kas kahepoolselt (erinevuse suund pole oluline) või ühepoolselt. Näiteks kogumi keskväärtuse testimisel

Kahepoolne hüpotees Ühepoolne hüpotees, vasak Ühepoolne hüpotees, parem
Nullhüpotees H0 μ = μ0 μ ≥μ0 μ ≤ μ0
Sisukas hüpotees H1 μ ≠ μ0 μ < μ0
μ >μ0

Otsustamiseks kasutatakse juhuvalimit. Me teame, et juhuvalimi põhjal saadud hinnang on juhuslik suurus ja kindlasti erineb nullhüpoteesiga püstitatud võrdusest. Aga kui suur see erinevus võib olla, et võime öelda: nullhüpotees on ümber lükatud ja tuleb vastu võtta sisukas hüpotees? Vaja kriteeriumi!

Järgmises interaktiivses demos on kahest erinevast üldkogumist võetud juhuvalimid. Ühe kogumi korral nullhüpotees kehtib, teise kogumi korral ei kehti. Kuidas ühe juhuvalimi põhjal otsustada, kas see tuleb kogumist, mille korral nullhüpotees kehtib, või tuleb see kogumist, mille korrral nullhüpotees ei kehti?



Demos oli tegemist kogumi keskväärtuse testimisega. Analoogselt toimub otsustamine igasuguse statistilise testimise korral. 

  • Otsustamiseks vajaliku statistilise kriteeriumi leidmiseks kasutatakse sobivat teststatistikut.
  • Valimi andmete põhjal arvutatakse teststatistiku empiiriline väärtus.
    • Sõltuvalt sellest, mida testitakse, on konkreetsed arvutusvalemid erinevad.
    • z-test, t-test, F-test, χ2-test, ....
  • Teststatistiku empiirilist väärtust võrreldakse vastava kriitilise väärtusega ja võetakse vastu otsus.
    • Kui empiiriline väärtus on nullist kaugemal kui kriitiline (asub kriitilises piirkonnas), on nullhüpotees ümber lükatud ja võetakse vastu sisukas hüpotees.
    • Kui empiiriline väärtus on nullile lähemal kui kriitiline (ei ole kriitilises piirkonnas), võetakse vastu nullhüpotees.

Erinevate teststatistikute  kriitiliste väärtuste leidmiseks olid vanasti statistilised tabelid. Näiteks tabelid õpikust Tamhane, A. C. " Statistical Analysis of Designed Experiments: Theory and application" Tänapäeval on võimalus kasutada arvutit. Näiteks Excelis on olemas funktsioonid erinevate teststatistikute kriitiliste väärtuste jaoks. Samuti on programmis Gretl Tools menüüs Statistical tables.  Kui aga andmed on Gretli andmebaasis, siis kõik testimise jaoks vajalikud arvutused tehakse automaatselt, kui valime menüüst meid huvitava testi.

Mille alusel aga põhimõtteliselt leitakse kriitiline väärtus, millest alates on nullhüpotees ümber lükatud ja võetakse vastu sisukas hüpotees? Selle selgitamiseks on järgmine demo. 


Demos vaadati, kuidas leitakse kriitilised väärtused kogumi keskväärtuse testimisel. Põhimõte on aga kõikide testide korral ühesugune: lähtutakse sellest, kuidas jaotuvad kehtiva nullhüpoteesi korral teststatistiku väärtused. Iga teststatistiku jaoks on vastav teoreetiline jaotusseadus, millele see statistik allub ja millest võetakse kriitilised väärtused. 

Jaotusseadus seob omavahel tõenäosuse ja statistiku väärtused. Pideva juhusliku suuruse korral tõenäosus, et see suurus omab mingit kindlat väärtust, on 0. Nullist erinev on tõenäosus, et juhuslik suurus on väiksem mingist väärtusest või suurem mingist väärtusest või jääb mingisse vahemikku. Järgneval joonisel on statistiku z jaotusseadus, kus horisontaalteljel on z väärtused. Tõenäosust kirjeldab kõvera alla jääv pindala. Rohelise piirkonna pindala on tõenäosus, et z<a.


Jaotusseadust võib kasutada kahel moel.

  1. Anda ette tõenäosus, et z on mingist väärtusest väiksem (suurem) ja leida vastav väärtus a.
  2. Anda ette väärtus a ja leida tõenäosus, et z on sellest väiksem (või suurem).

Siit tuleb ka kaks võimalust otsustamaks, kumb hüpotees tuleb vastu võtta.