Kursus „Tõenäosusteooria ja matemaatilise statistika elemente”
Statistiliste andmete kogumisele järgneb andmete töötlemine ehk andmeanalüüs. Selle käigus leitakse arvulised suurused ehk näitajad (karakteristikud), mis iseloomustavad tunnuse väärtuste jaotust kui tervikut mingist seisukohast. Põhilised karakteristikud jagunevad kahte rühma: 1) paiknemise karakteristikud ehk keskmised ja 2) hajuvuse karakteristikud.
Paiknemise karakteristikud annavad informatsiooni tunnuse väärtuste paiknemise kohta arvteljel ja iseloomustavad tunnust keskmise väärtuse seisukohalt.
Hajuvuse karakteristikud näitavad, mil määral erinevad tunnuse väärtused keskmisest, hajuvad keskmise ümber.
Vaatleme keskmisi. Need on aritmeetiline keskmine, mediaan ja mood.
Aritmeetiliseks keskmiseks nimetatakse tunnuse kõigi väärtuste summa ja kogumi mahu (objektide arvu) jagatist.
Aritmeetilist keskmist tähistatakse sümboliga
Nagu eespool selgitasime, on alati otstarbeks esitada statistilise rea andmed sagedustabelina:

Nüüd on aritmeetiline keskmine
.
Seda valemit nimetatakse ka kaalutud (aritmeetiliseks) keskmiseks, sest sagedused fi näitavad, kui suur osakaal ehk kaal on tunnuse väärtusel xi teiste väärtuste seas.

Kui andmestik on esitatud jaotustabeliga, on
1)
2)
Tõepoolest, kui
Analoogiliselt saame aritmeetilise keskmise
Näide 1.
Peatüki 3.1 näite 2 klassi A andmetel on kontrolltöö hinnete aritmeetiline keskmine
Sama töö hinnete aritmeetilise keskmise saame ka näite 3 esimese jaotustabeli andmetest (klass A):
Kui statistiline andmestik on esitatud vahemikena, leitakse iga vahemiku esindaja, tavaliselt vahemiku xi < x ≤ xi+1 keskmine väärtus
millega arvutatakse edasi nagu tunnuse üksikute väärtuste korral.
Näide 2.
Leiame peatüki 3.1 näites 4 saadud tabeli andmetel õpilaste pikkuste aritmeetilise keskmise. Arvutused vormistame tabelina, mida on eriti otstarbekas teha (tasku)arvuti puudumisel.

Vaadeldava klassi õpilaste keskmine pikkus on 167 cm.
Mediaaniks nimetatakse tunnuse väärtust, millest suuremaid (või võrdseid) ja väiksemaid (või võrdseid) liikmeid on variatsioonreas ühepalju.
Mediaani tähistatakse sümboliga Me või me, andmetöötlussüsteemides MEDIAN. Kui variatsioonreas on paaritu arv liikmeid (N on paaritu arv), on mediaaniks variatsioonrea keskmine liige. Kui aga variatsioonreas on paarisarv liikmeid, on mediaaniks kahe keskmise liikme aritmeetiline keskmine. Lühemalt:
Näide 3.
Ühe klassi noormeeste kinganumbrite variatsioonrida on 39, 39, 40, 40, 40, 40, 41, 41, 41, neiudel aga 35, 35, 35, 35, 36, 39. Leiame vastavad mediaanid.
Et esimesel juhul on N = 9, siis Me = x5 = 40, sest keskmiseks liikmeks on x5. Sama indeksi saaksime ka valemiga i = 0,5(9 + 1) = 5. Neiude kinganumbrite variatsioonreas on paarisarv liikmeid (N = 6), seega Me = 0,5(x3 + x4) = 0,5(35 + 35) = 35.
Näide 4.
Järgnevas tabelis on esitatud kontrolltöö hinded. Leiame hinnete mediaani sageduste ja suhteliste sageduste abil.
![]() |
Et hindeid on paarisarv ja N = 28, siis Me = 0,5(x14 + x15). Liites järjest sagedusi, saame, et x14 = x15 = 4. Järelikult Me = 4.
Suhteliste sageduste korral liidame järjest protsente ja vaatame, millise hinde korral saab summa suuremaks kui 50%: 11 + 25 = 36, kuid 11 + 25 + 36 > 50. Seega sai neljade lisamisel sageduste summa suuremaks kui 50% ja järelikult Me = 4.
Vahemikes esitatud sagedus- või jaotustabeli korral toimitakse nii nagu näites 4, aga tulemuseks saadakse nn mediaanvahemik. Näite 2 andmete korral on selleks vahemik 165 < x ≤ 170. Kui opereerida intervalli esindajaga, saame mediaaniks 167,5. Vastavast variatsioonreast (peatükk 3.1, näide 4) leiame, et Me = 167.
Kuigi aritmeetiline keskmine on keskmistest enamkasutatav, on juhtumeid, kus mediaan on sobivam. Nii on siis, kui variatsioonreas on üksikuid ebaharilikult suuri või väikseid väärtusi ja kogumi maht on väike. Nüüd nihkub aritmeetiline keskmine arvteljel kohta, kus tunnuse väärtusi tegelikult pole või on väga vähe. Mõningal määral ilmneb see ka näite 3 korral, kus neiude keskmine kinganumber
Mediaani saab kergesti leida ja samas on ta hea aritmeetilise keskmise ligikaudseks hindamiseks. Mida sümmeetrilisem on tunnuse jaotus, seda paremini iseloomustab mediaan keskmist. Näiteks noormeeste kinganumbrite mediaan näites 3 on 40, aritmeetiline keskmine aga 40,1. Mediaani saab sageli leida ka ühe või kahe mõõtmise teel. Leides näiteks õpilaste pikkuse mediaani, rivistame õpilased pikkuse järgi ja seejärel mõõdame vaid rea keskel asuva ühe või kahe õpilase pikkuse.
Moodiks nimetatakse tunnuse kõige sagedamini esinevat väärtust.
Moodi tähistatakse sümboliga Mo või mo, andmetöötlussüsteemides MODE. Kontrolltöö hinnete mood on näite 4 korral 4, sest sellele vastav sagedus on kõige suurem (f = 10 või w = 36%). Kui andmed on esitatud vahemikes, antakse kõige suurema sagedusega vahemik. Näite 2 korral on selleks vahemik 165 < x ≤ 170.
Tunnusel võib moode olla ka rohkem kui üks või tal võib ka mood puududa (kõigi väärtuste esinemise sagedus on sama). Kui moode on kaks, öeldakse, et tunnus (vaadeldav jaotus) on bimodaalne.
Kui jaotus on täiesti sümmeetriline ja sellel on üks mood, on
Moodi kasutatakse majanduses, kaubanduses, tarbija vajaduste uurimisel jne. Mõningatel juhtudel võib moodi ja ka aritmeetilist keskmist vaadelda kui normi. Näiteks meeste soengu mood kui normaalne soeng, esmaabiellujate vanuse mood või keskmine vanus kui normaalne abiellumisaeg.
Näide 5.
Eesti statistikaameti andmetel oli 1970-ndatel aastatel esmaabielluvate meeste keskmine vanus valdavalt 25 aastat ja naistel 23 aastat. Meeste osas langes see 1991. aastaks vanuseni 24,5 aastat ja naiste osas 1992. aastaks vanuseni 22,3 aastat. Edasi hakkas nii meestel kui ka naistel esmaabiellujate keskmine vanus kasvama ja jõudis 2016. aastaks meestel vanuseni 32,1 aastat ning naistel 29,8 aastat.
Ülesanded

Vastus. Keskmine silmade arv ühe lasuga on .
![]() |
![]() |
Vastus. A klassi keskmine hinne on ja B klassi keskmine hinne on . Järelikult

Koostage antud tabeli põhjal uus sagedustabel, kus klasse on vaid kolm. Arvutage nüüd õpilaste pikkuste aritmeetiline keskmine ja võrrelge seda eelneva tulemusega.
Pikkus X | fi | Vahemiku esindaja xi | fixi |
< x ≤ | |||
< x ≤ | |||
< x ≤ | |||
Kokku |
Vastus. Müüdud kingade numbrite mediaan on .

Milline on Eestis 2016. aasta andmetel meeste ja naiste vanuse mediaanvahemik ja kõige sagedamini esinev vanusevahemik?
Vastus. Mediaanvahemik oli meestel ja naistel aastat. Kõige sagedamine esinev vanusevahemik oli meestel ja naistel aastat.

Vastus. Kõige vähem lapsi sündis ( last) ja kõige rohkem ( last). Nende laste arvude erinevus on last. Keskmine laste sündimise protsent on
Vastus. Mo =

Me =
Mo = ja
Vastus. Mo =

Vastus. Mo =
Vastus. India elevantide keskmine mass on kg.
Vastus. India elevantide massi mediaanvahemik on , suurima sagedusega vahemik on ja massi aritmeetiline keskmine on .
Leidke oma klassi viimase matemaatika kontrolltöö hinnete
Vastus.
Vastus. Kahe klassi peale kokku on vaadeldava töö keskmine hinne .