Статистическая вероятность

Курс „Элементы теории вероятностей и математической статистики”

При классическом определении вероятности предполагается, что все исходы испытания равновозможны. Однако это не всегда удается установить, кроме того, есть и такие испытания, в которых различные исходы не являются равновозможными.

Хорошим примером является изучение рождаемости. Хотя различных возможностей всего две – родится мальчик или родится девочка, эти исходы не равновозможны. Как уже отмечалось в одной из задач, вероятность Р(родится мальчик) = 0,514, следовательно, Р(родится девочка) = 0,486.

Как же найти вероятность события в таких случаях?

Рассмотрим некоторое событие А, которое при каждом испытании либо происходит, либо не происходит. Предположим также, что одинаковые испытания можно повторять неограниченное число раз. При этом различные возможные исходы испытания уже не обязаны быть равновозможными (хотя могут и быть таковыми). Если в одной серии из n испытаний событие А наступило m раз, то число m называется частотой[понятие: Частота (sagedus) – частота (или абсолютная частота) появления события – число появлений события в некоторой серии испытаний.] (или абсолютной частотой) появления события А, а отношение \frac{m}{n}относительной частотой[понятие: Относительная частота (suhteline sagedus) – число, показывающее, какую часть всей серии испытаний занимают испытания, в которых произошло данное событие. Относительную частоту выражают обыкновенной дробью, десятичной дробью или же в процентах.] появления этого события. Относительную частоту нередко выражают и в процентах.

Статистической вероятностью[понятие: Статистическая вероятность (statistiline tõenäosus) – относительная частота появления события при достаточно больших сериях испытаний.] события А называется относительная частота mn, появления события А при достаточно больших сериях испытаний (т. е. при достаточно большом n).

Выражения при достаточно больших сериях испытаний или при достаточно большом n могут поначалу показаться весьма неопределенными и даже несущественными. Следующие примеры должны убедить нас в том, что иногда число испытаний n должно быть действительно очень большим, если мы хотим получить достаточно точное значение вероятности. Кроме того, при изучении различных явлений приходится делать разное число испытаний, чтобы получить требуемую точность результата.

Пример 1.

Английский математик Карл Пирсон (Karl Pearson) сделал 12 000 бросаний монеты, причем орел выпал 6019 раз. Затем он сделал еще 12 000 бросаний и на сей раз орел выпал 5993 раза. В первой серии испытаний относительная частота выпадения орла равнялась 0,5016, а во второй серии – 0,4994. В соответствии с определением статистической вероятности именно эти числа могут быть приняты за вероятность выпадения орла. С другой стороны, эти две серии испытаний можно объединить в одну серию, где n = 24 000 и частота выпадения орла составляет 12 012. Теперь статистическая вероятность случайного события, заключающегося в выпадении орла, оказывается равной 0,5005.

Из рассмотренного примера видно, что статистическая вероятность события является приближенной оценкой классической вероятности этого события (например, при бросании монеты вероятность выпадения орла равна 0,5). Можно также сделать предположение, что чем длиннее серия испытаний, тем меньше относительная частота наступления события отличается от его классической вероятности (при 12 000 испытаний отличие было равно 0,0016, при 24 000 испытаний – 0,0005). С полной уверенностью это утверждать нельзя – бывают и случаи, когда частота сильно отличается от классической вероятности. Оказывается, что для длинных серий испытаний вероятность такой аномалии становится очень малой. Более точно:

чем длиннее серия испытаний, тем ближе к 1 вероятность того, что относительная частота mn появления события все меньше отличается от его вероятности p.

Сказанное выражает смысл известного в теории вероятностей закона больших чисел[понятие: Закон больших чисел (suurte arvude seadus) – чем длиннее серия испытаний, тем ближе к 1 вероятность того, что относительная частота появления события все меньше отличается от классической вероятности этого события.].

Пример 2.

Найдем на основании статистических данных вероятность рождения мальчика. Для этого воспользуемся данными о рождаемости в Эстонии в 1986–1994 годах. За этот промежуток времени в Эстонии родилось 187 526 детей, из которых 96 477 составляли мальчики. Поэтому относительная частота рождения мальчиков есть \frac{96\ 477}{187\ 526}\approx0,51447. Приближенное значение p = 0,514 и можно взять за вероятность (статистическую) рождения мальчика. 

Если по тем же данным подсчитать число родившихся мальчиков, приходящееся на каждые 100 родившихся девочек, то мы получим 105,96 (вычислив по вероятности 0,514, получим 105,76). Полученные результаты совпадают с подмеченной уже в XVII веке закономерностью, согласно которой на каждые 100 родившихся девочек приходится 105–106 рождений мальчиков.

Статистическая вероятность события обладает теми же свойствами, что и классическая вероятность:

  1. 0\le\frac{m}{n}\le1, так как 0\le m\le n,
  2. P\left(U\right)=\frac{n}{n}=1,
  3. P\left(V\right)=\frac{0}{n}=0,
  4. P\left(A\right)+P\left(\overline{A}\right)=1, так как \frac{m}{n}+\frac{n-m}{n}=1.

Таким образом, в дальнейшем не нужно учитывать, каким способом вычислена вероятность. Корректно найденной вероятностью можно во всех случаях пользоваться без опаски.

Упражнения

Ответ: процент всхожести семян составляет . Вероятность того, что случайным образом выбранное семя даст росток, равна . Из посаженных 374 семян можно надеяться получить  растений.

По данным таблицы вычислите вероятность того, что новорожденный мальчик проживет не менее 50 лет.

Ответ: вероятность того, что новорожденный мальчик проживет не менее 50 лет, равна.

По данным таблицы вычислите вероятность того, что 15-летняя девушка доживет по крайней мере до 70-летнего возраста.

Ответ: вероятность того, что 15-летняя девушка доживет по крайней мере до 70-летнего возраста, равна .

По данным таблицы вычислите вероятность того, что 40-летняя женщина доживет по крайней мере до 80-летнего возраста.

Ответ: вероятность того, что 40-летняя женщина доживет по крайней мере до 80-летнего возраста, равна  .

По данным таблицы вычислите вероятность того, что 3-летний мальчик и его новорожденная сестра оба доживут до 60-летнего возраста.

Ответ: вероятность того, что 3-летний мальчик и его новорожденная сестра оба доживут до 60-летнего возраста, равна .

По данным таблицы вычислите вероятность того, что 80-летняя женщина не доживет до 85 лет.

Ответ: вероятность того, что 80-летняя женщина не доживет до 85 лет, равна .

По данным таблицы найдите, до какого возраста с вероятностью 0,5 может прожить мужчина и до какого возраста – женщина.

Ответ:

  1. мужчина;
  2. женщина.

Ответ: в среднем исправными будут  лампочек.

Ответ: вероятность того, что изготавливаемое в настоящий момент изделие окажется особо качественным, составляет.

Ответ: вероятность того, что изготавливаемая деталь окажется стандартной, равна. Чтобы получить 1000 стандартных деталей, нужно изготовить в среднем  деталей.