Kursus „Tõenäosusteooria ja matemaatilise statistika elemente”
Kahe statistilise kogumi sagedustabelid on järgmised:

Mõlema kogumi korral on sama N = 28,
Mõnel juhul iseloomustab hajuvust mingil määral tunnuse muutumispiirkond või selle pikkus – variatsioonrea ulatus, s.t piirkond minimaalsest väärtusest maksimaalse väärtuseni. Antud juhul on aga ka tunnuse muutumispiirkond mõlemas kogumis sama: 7 ≤ x ≤ 13.
Seame eesmärgiks leida karakteristiku, mis iseloomustab tunnuse hajuvust aritmeetilise keskmise suhtes.
Tunnuse üksiku väärtuse xi kõrvalekallet (erinevust) keskmisest
Kogu variatsioonrea (andmestiku) kui terviku hajuvust

Et saadud tabeli põhjal on vahetult raske midagi otsustada tunnuse hajuvuse üle, oleks tarvis vastavat koondnäitajat, karakteristikut. Võib tunduda, et selleks sobib keskmine hälve (hälvete aritmeetiline keskmine). Kuid see on alati null, sest juba
aritmeetilise keskmise suhtes arvutatud hälvete summa on null, s.t .
Tõepoolest:
Et vältida hälvete vastastikust koondumist nulliks, kasutatakse hajuvust iseloomustava suurusena hälvete ruutude (saame positiivsed arvud) aritmeetilist keskmist, mida nimetatakse dispersiooniks ja tähistatakse sümboliga σ2 (ka s2), arvutipõhistes arvutussüsteemides VARP.
Seega on dispersioon
Mida suurem on σ2, seda suurem on tunnuse väärtuste hajuvus.
Saadud karakteristikul on aga üks oluline puudus – tema ühikuks on tunnuse ruutühik. Kui näiteks arvutame klassi õpilaste pikkuse (mõõtühikuks cm) hajuvust keskmise pikkuse (ka cm) suhtes, siis on hajuvuse mõõtühikuks cm2. Et sellest ebakõlast vabaneda, kasutatakse hajuvuse karakteristikuna standardhälvet σ (ka sümbol s):
Arvutipõhistes süsteemides esineb sümbol STDEVP.
Enamiku tunnuste korral erineb üle poole andmetest aritmeetilisest keskmisest vähem kui standardhälbe σ võrra. Teisiti öeldes paikneb tavaliselt enamik tunnuse väärtustest piirkonnas
Näide 1.
Leiame käesoleva peatüki alguses esitatud statistiliste andmete korral standardhälbed. Arvutused vormistame arvutuste lihtsustamise ja arusaadavuse huvides tabelina. Mõlemal juhul oli

I kogumi korral on
Tulemus kinnitab veel kord, et teise kogumi tunnuse väärtused hajuvad rohkem kui esimese kogumi tunnuse väärtused. Seejuures asub esimese kogumi korral piirkonnas
Aritmeetiline keskmine koos standardhälbega esitatakse sageli järgmiselt: I juhul
Osutub, et tunnuse väärtuste hajuvus aritmeetilise keskmise suhtes on alati väiksem kui mis tahes teise arvu suhtes, ehk teisiti,
tunnuse väärtused paiknevad kõige tihedamini aritmeetilise keskmise ümber.
Dispersiooni σ2 arvutamiseks saab defineerivast võrdusest tuletada praktilisema valemi
kus
Näide 2.
Laskur lasi märklauda, millele oli märgitud silmade arvud 1, 2, 3, 4 ja 5. Kui lask läks mööda, sai ta 0 silma. Laskja kahekümne lasu tulemused on järgnevas tabelis.
Arvutame, mitu silma sai laskur keskmiselt ühe lasuga ja kui suur on hajuvust iseloomustav standardhälve. Mitu protsenti laskudest asub vahemikus
![]() |
Tabelis tehtud arvutuste põhjal saame, et ühe lasuga tuli keskmiselt
Kahe kogumi võrdlemine hajuvuse seisukohalt taandub standardhälvete võrdlemisele. Nii tehakse näiteks ülesande 125 lahendamisel ja see on õigustatud, sest vastavad andmed asuvad sama skaala piirkonnas. Kui aga andmed on erinevatel skaaladel, näiteks tahetakse võrrelda algkooli poiste ja täiskasvanud meeste pikkuse hajuvust vastavate keskmiste suhtes, ei ole selliselt õige toimida. Põhjuseks on liiga erinev pikkuste tase, mis avaldub ka aritmeetiliste keskmiste endi erinevuses. Niisugusel juhul on sobivam leida nn suhteline hajuvus, võrreldes keskmisega. See on
mida nimetatakse variatsioonikordajaks, ja nagu ikka suhtarvu, võib selle esitada ka protsentides. Variatsioonikordajal on mõte vaid siis, kui tunnuse väärtused on positiivsed. Analoogiline situatsioon on erinevates ühikutes (näiteks sentimeetrites ja kilogrammides) mõõdetud tunnuste hajuvuse võrdlemisel. Nii näiteks tuleb kasutada variatsioonikordajat, kui uuritakse, kas 11. klassi noormeeste kehakaalu või pikkuse hajuvus on suurem.
Ülesanded
![]() |
Leidke hinnete aritmeetiline keskmine ja standardhälve ning hinnake, kummas klassis tehti kontrolltöö paremini. Kui palju hindeid (ka protsentides) paikneb kummalgi juhul piirkonnas
Vastus. A klassis oli hinnete aritmeetiline keskmine ja standardhälve ning B klassis oli hinnete aritmeetiline keskmine ja standardhälve . Järelikult kontrolltöö tehti paremini klassis. Piirkonnas

Leidke laskuri tulemuste hajuvus. Kui palju tulemustest paikneb piirkonnas
Vastus. σ = . Piirkonnas
Leidke oma klassi viimase matemaatika kontrolltöö hinnete hajuvus, leidke ka piirkond