Seni oleme vaadelnud peamiselt väikseid statistilisi kogumeid ja uurinud neid keskmiste ja hajuvuse seisukohalt. Üsna tihti on tarvis uurida aga väga suuri statistilisi kogumeid, näiteks Eesti elanikkonda. On selge, et sellise uuringu tegemine on väga töömahukas ja kulukas. Et hoida kokku aega ja raha, moodustatakse suurest kogumist, mida nimetatakse üldkogumiks, suhteliselt väike statistiline kogum, mida nimetatakse valimiks, ja uuritakse siis seda. Selliselt toimides kerkib aga esile rida probleeme, millest kahel järgnevalt peatume.
Esiteks, kuidas moodustada valimit, et uurimistulemused peegeldaksid võimalikult õigesti üldkogumit. Ei ole ju näiteks õige kõigi üldhariduslike koolide õpilaste uurimisel igapäevaste kulutuste seisukohalt moodustada valim üksnes Tallinna õpilastest või vaid tütarlastest üle Eesti. Õige oleks moodustada valim nii, et see vastaks oma koosseisult nii kõigile kooliastmetele, õpilaste geograafilisele paiknemisele, soole ja seejuures võimalikult samades proportsioonides nagu see on üldkogumis. Üldjuhul öeldakse, et valim peab olema üldkogumi suhtes esinduslik (ehk representatiivne). Ka valimi suurus mõjutab üldkogumile üldistatavate tulemuste õigsust.
Teiseks on küsimus selles, kas valimi näitajad (tulemused) võime lugeda kehtivaks ka üldkogumi jaoks. Üldiselt ei. Valimi elemendid võtame ju üldkogumist lõpuks ikka (vastavatest koolitüüpidest ja -astmetest, koolide asukohtadest, soost jne) juhuslikult. Seetõttu on valimi näitajad (
Järgnevalt vaatleme, kuidas hinnatakse üldkogumi aritmeetilist keskmist, kui on teada valimi aritmeetiline keskmine ja standardhälve või dispersioon.
Üldkogumi aritmeetilise keskmise jaoks ei saa põhimõtteliselt anda täpset väärtust. Seetõttu antakse üldkogumi aritmeetilise keskmise jaoks hinnang, milleks on vahemik, kus aritmeetiline keskmine arvatavasti asub. „Arvatavasti“ on aga ebamäärane kinnitus sellele, et aritmeetiline keskmine asub just leitud vahemikus. Seetõttu täpsustatakse seda kindluse astet tõenäosusega (tavaliselt protsentides). Nii saadakse üldkogumi aritmeetilise keskmise hinnang järgmisel kujul: tõenäosusega 95% (või 60% või 99% või 99,5%) asub aritmeetiline keskmine vahemikus …
Miks ei anta soovitud vahemikku tõenäosusega 1? Siis oleks ju täiesti kindel, kus aritmeetiline keskmine asub. Toome näite: tõenäosusega 1 ehk 100% võib (mingeid arvutusi tegemata) öelda, et Eesti kõigi 11. klassi õpilaste keskmine pikkus on vahemikus 140 cm … 220 cm. See väide on kindlasti õige, samas pole nii ebamäärase teadmisega praktikas midagi peale hakata. Osutub, et kui vähendada väite kindluse astet, näiteks anda vajalik vahemik tõenäosusega 95%, muutub vahemik kitsamaks. Kaotame väite kindluse astmes, kuid saame lühema piirkonna, mis midagi juba ütleb.
Vaatleme, kuidas leida kõnealust vahemikku.
Tõenäosust, tähis 1 – α, millega väidetakse üldkogumi aritmeetilise keskmise paiknemist teatud vahemikus, nimetatakse usaldusnivooks. Tõenäosust α nimetatakse aga olulisuse nivooks (ka riski nivooks). Kui näiteks usaldusnivoo on 95% ehk 0,95, siis olulisuse nivoo on vastavalt 5% ehk 0,05. Vahemikku, kus asub üldkogumi aritmeetiline keskmine, nimetatakse usaldusvahemikuks ja selle otspunkte usalduspiirideks. Need leitakse valemitega
kus n on valimi maht,
Valimi aritmeetilist keskmist nimetatakse üldkogumi aritmeetilise keskmise punkthinnanguks ja usaldusvahemikku vahemikhinnanguks.
Näide 1.
Suure kooli arst tahab hinnata nelja paralleelklassi poiste pikkust. Selleks moodustas ta juhusliku valiku teel 30 poisist valimi ja mõõtis valimisse sattunud poiste pikkused. Keskmine pikkus koos standardhälbega tuli
alumine
ülemine 174,1 + 1,87 ≈ 175,96 ≈ 176,0.
Seega on tõenäosusega 99% kõigi nelja paralleelklassi poiste keskmine pikkus piirkonnas
Et piirkonna ulatus on peaaegu 4 cm, otsustas arst leida kitsama piirkonna. Selleks võttis ta usaldusnivooks 95%, mis annab α = 0,05 ja tabelist
Näide 2.
Eelmises näites saadud tulemuse kontrolliks moodustas kooliarst juhusliku valiku teel uue valimi. Seekord oli poisse valimis 37. Nüüd tuli keskmine pikkus
Et esimese valimi (näite 1) korral tuli
Tegelikult on olemasolevate andmete põhjal matemaatiliselt võimalik hinnata, kas tulemuste 174,1 cm ja 174,9 cm erinevust tuleb lugeda oluliseks (siis on tulemused erinevad) või mitteoluliseks (siis on tulemuste erinevus juhuslikkusest tingitud). Seda tehakse vastavate usaldusvahemike võrdlemise teel. Kui usaldusvahemikud osaliselt kattuvad, tuleb erinevus lugeda ebaoluliseks. Kui aga usaldusvahemikel ühisosa puudub, tuleb keskmised lugeda erinevateks. Jooniselt 1.22 on näha, et usaldusnivoo 99% korral on usaldusvahemikel olemas pikk ühisosa, milles võib asuda üldkogumi keskmine. Seega on erinevate valimite keskmiste erinevus ebaoluline ja arstil ei ole põhjust muretsemiseks.

Studenti t-jaotuse väärtused

* Kui järgmised n – 1 väärtused tabelis puuduvad, tähendab see, et suurusele α vastavad väärtused on samad, mis tärniga reas.
Ülesanded A
Ülesanne 181. Elektripirnid
Katsetamisel saadi pirnide keskmine põlemisaeg
Vastus. Elektripirnide keskmise põlemisaja usaldusvahemik usaldusnivooga 0,95 on [; ].
Ülesanne 182. Kontrolltööde keskmiste hinnete usaldusvahemikud
Ülesanne 183. India elevantide keskmine kaal
Vastus. Tõenäosusega 95% on india elevantide keskmine kaal piirkonnas
[; ].
Ülesanne 184. Kontrolltöö tulemused
![]() |
Kas A ja B klassi kontrolltööde hinnete keskmiste erinevus on oluline või mitteoluline (töö tehti sama hästi) usaldusnivooga 95%?
Vastus. Usalduspiirid on:
A klassis [; ] ja
B klassis [; ].
Need , seega on tulemuste erinevus .