Statistiline tõenäosus

Sündmuse klassikalise tõenäosuse definitsioon eeldab sündmuse kõigi võimaluste võrd­võimalikkust (vt art. 1.4). Seda ei ole aga sageli võimalik kindlaks teha või siis kõik üksik­juhud ei olegi võrd­võimalikud.

Olgu poeg­lapse sünd sündmus A. Kui eeldada, et sündmuse A jaoks on kõiki võimalusi kaks – sünnib kas poiss või sünnib tüdruk – pole selge, kas need võimalused on võrd­võimalikud. Järelikult ei või poeg­lapse sündimise tõenäosust arvutada klassikalise tõenäosuse definitsiooni järgi.

Kuidas aga sellisel juhul sündmuse tõenäosust leida?

Olgu vaatluse all sündmus A, mis iga katse korral (ka vaatlus on katse) kas toimub või ei toimu. Eeldame, et katseid saab korrata kui tahes palju kordi järjest. Katse võimalikud erinevad tulemused ei pea see­juures olema (aga võivad olla) võrd­võimalikud. Kui sündmus A esines n katse korral (ühe katse­seeria korral) m korda, siis arvu m nimetatakse sündmuse A sageduseks (täpsemalt absoluutseks sageduseks) ning suhet

\frac{m}{n}

sündmuse A suhteliseks sageduseks (ka relatiivseks sageduseks). Suhtelist sagedust väljendatakse sageli protsentides.

Sündmuse A statistiliseks tõenäosuseks nimetatakse sündmuse A suhtelist sagedust mn, kui katsete arv n on küllalt suur.

Definitsiooni lõpp kui katsete arv n on küllalt suur tundub esi­algu olevat eba­määrane ja võib-olla isegi eba­oluline. Järgnevad näited peaksid meid aga veenma, et katsete arv n peab olema vahel tõesti suur, saamaks tuntud tõenäosuse küllalt täpselt. Teiseks on erinevate nähtuste korral vajalik teha väga erinev arv katseid, et saada vajaliku täpsusega tulemus.

Näide 1.

Inglise matemaatik Karl Pearson viskas münti 12 000 korda ja vapp esines 6019 korda. See­järel viskas ta münti veel 12 000 korda ning vapp esines nüüd 5993 korda. Esimese katse­seeria korral oli vapi esinemise suhteline sagedus 0,5016, teise seeria korral aga 0,4994. Neid arve võib definitsiooni kohaselt võtta vapi esinemise statistiliseks tõenäosuseks, kuid Pearsoni poolt tehtud katseid võib vaadelda ka ühe katse­seeriana, kus n = 24 000 ja vapi esinemise sagedus on 12 012. Nüüd on vapi tuleku (kui juhusliku sündmuse) statistiline tõenäosus 0,5005.

Näitest selgub, et sündmuse statistiline tõenäosus on sündmuse klassikalise tõenäosuse (mündi viskamisel on vapi tuleku tõenäosus 0,5) hinnanguks. Võib teha ka oletuse, et mida suurem on katsete arv, seda vähem erineb sündmuse suhteline sagedus klassikalisest tõenäosusest (12 000 katse järel oli erinevus 0,0016, 24 000 katse järel 0,0005). Selgub, et viimane väide nii resoluutsena siiski ei kehti. Osutub, et pikkade katse­seeriate puhul ei erine sündmuse suhtelised sagedused klassikalisest tõenäosusest tõenäoliselt kuigi palju; teisiti öeldes:

mida rohkem tehakse katseid, seda tõenäosem on, et sündmuse suhteline sagedus mn erineb sündmuse tõenäosusest p järjest vähem.

Öeldu väljendab tõenäosus­teoorias tuntud suurte arvude seaduse mõtet.

Näide 2.

Leiame statistiliste andmete põhjal poeg­lapse sündimise tõenäosuse. Kasutame selleks Eesti kohta käivaid andmeid aastaist 1986–1994. Nimetatud aja­vahemikul sündis Eestis 187 526 last, kellest 96 477 olid poisid. Seega oli poeg­laste sündimise suhteline sagedus \frac{96477}{187526}\approx0,51447. Ümardades tulemuse tuhandikeni, saame arvu p0,514, mida loetaksegi poeg­lapse sündimise (statistiliseks) tõenäosuseks. Nagu tulemus kinnitab, ei olegi poeg- ja tütar­lapse sündimine võrd­võimalikud juhud (tõenäosused 0,514 ja 0,486).

Arvutades samadel Eesti kohta käivatel andmetel 100 vast­sündinud tüdruku kohta tuleva poiste sünni­juhtude arvu, saame 105,96 (tõenäosuse 0,514 järgi 105,76). Need tulemused ühtivad juba 17. sajandil fikseeritud seadus­pärasusega, et iga 100 tüdruku sünni kohta tuleb 105–106 poisi sündi.

Sündmuse statistilise tõenäosuse korral kehtivad samad omadused, mis sündmuse klassikalise tõenäosuse korral:

  1. 0\le\frac{m}{n}\le1, sest 0\le m\le n,
  2. P\left(U\right)=\frac{n}{n}=1,
  3. P\left(V\right)=\frac{0}{n}=0,
  4. P\left(A\right)+P\left(\overline{A}\right)=1, sest \frac{m}{n}+\frac{n-m}{n}=1.

Järelikult ei ole edas­pidi põhjust vahet teha, kuidas tõenäosus arvutati. Tõenäosust, mis on korrektselt leitud, tuleb kõikjal kasutada üht­viisi.

Ülesanded A

Ülesanne 140. Seemete idanevus

Vastus. Seemete idanemis­protsent on . Tõenäosus, et samast kotist juhuslikult võetud seeme idaneb, on . Külvatud 374 seemnest on loota saada  taime.

Ülesanne 141. Tähe a, s, k või i esinemine tekstis

Ülesanne 142. Üle­elamise tabel

Arvutage tabeli andmetel tõenäosus, et vast­sündinud poiss elab vähemalt 50-aastaseks.

Vastus. Tõenäosus, et vast­sündinud poiss elab vähemalt 50-aastaseks, on .

Arvutage tabeli andmetel tõenäosus, et 15-aastane neiu elab vähemalt 70-aastaseks.

Vastus. Tõenäosus, et 15-aastane neiu elab vähemalt 70-aastaseks, on .

Arvutage tabeli andmetel tõenäosus, et 40-aastane naine elab vähemalt 80-aastaseks.

Vastus. Tõenäosus, et 40-aastane naine elab vähemalt 80-aastaseks, on .

Arvutage tabeli andmetel tõenäosus, et 3-aastane vend ja vast­sündinud õde elavad mõlemad vähemalt 60-aastaseks.

Vastus. Tõenäosus, et 3-aastane vend ja vast­sündinud õde elavad mõlemad vähemalt 60-aastaseks, on .

Arvutage tabeli andmetel tõenäosus, et 85-aastane naine ei ela 90-aastaseks.

Vastus. Tõenäosus, et 85-aastane naine ei ela 90-aastaseks, on .

Ülesanne 143. Üle­elamise tabel

Leidke tabeli abil, millise vanuseni elamise tõenäosus on 0,5

  1. meestel;
  2. naistel.
Ülesanne 144. Kvaliteetsed elektri­pirnid

Vastus. Keskmiselt on kvaliteetsed  pirni.

Ülesanne 145. Eriti vastu­pidav toode

Vastus. Tõenäosus selleks, et selles ette­võttes parajasti valmiv toode on eriti vastu­pidav, on .

Ülesanne 146. Detaili valmistamine

Vastus. Tõenäosus, et valmiv detail ei ole praak, on . 1000 valmistatud detaili seas on keskmiselt  standardset detaili.

Ülesanded B

Ülesanne 147. Valgus­foori tsükkel

Ülesanne 148. Kuuli võtmine urnist

Nii toimiti palju kordi ja leiti, et rohelise kuuli saamise statistiline tõenäosus on \frac{1}{12}, valge kuuli korral \frac{1}{4}, sinise korral \frac{7}{20}, punase korral \frac{2}{15}, ja musta korral \frac{1}{6}. Mitu rohelist, valget, sinist, punast ja musta kuuli oli tõenäoliselt urnis? Mitut erinevat värvi kuule oli arvatavasti üldse urnis?

Vastus. Urnis on tõenäoliselt  rohelist,  valget,  sinist,  punast ja  musta kuuli. Arvatavasti on urnis  erinevat värvi kuule.