Закон больших чисел
В этой статье мы объясним, что такое закон больших чисел и для чего он используется в теории вероятности и статистике. Вы также сможете увидеть пример применения закона больших чисел и, кроме того, какова связь между этим законом и центральной предельной теоремой.
В чем заключается закон больших чисел?
В теории вероятностей закон больших чисел — это правило, описывающее результат выполнения большого количества действий. Более конкретно, закон больших чисел гласит, что среднее значение результатов, полученных в результате большого количества испытаний, будет близко к ожидаемому значению.
Более того, согласно закону больших чисел, чем больше экспериментов мы проведем, тем ближе результаты будут к ожидаемому значению.
Например, если мы подбросим монету пять раз, орел выпадет только один раз (20%). Однако если монету подбросить несколько раз (более 1000 подбрасываний), почти половина результатов будет орлом (50%), поскольку это ее ожидаемое значение. Это пример закона больших чисел.
Зарождение закона больших чисел относится к XVI веку у Джероламо Кардано, однако в разработке этого статистического закона на протяжении всей истории участвовали многие авторы: Бернулли, Пуассон, Чебышев, Марков, Борель, Кантелли, Колмогоров и Хинчин.
Пример закона больших чисел
Увидев определение закона больших чисел, мы увидим конкретный пример, чтобы лучше понять его смысл. В этом случае мы проанализируем вероятности возможных результатов, которые мы можем получить, бросив игральную кость.
При броске игральной кости существует шесть возможных исходов (1, 2, 3, 4, 5 и 6), поэтому теоретическая вероятность каждого элементарного события равна:
Поэтому мы затем несколько раз смоделируем запуск и запишем результаты в таблицу частот , чтобы проверить, соблюдается ли закон больших чисел.
Чтобы вы могли убедиться в важности количества проведенных экспериментов, мы смоделируем сначала десять запусков, затем сто и, наконец, тысячу. Таким образом, результаты, полученные в результате моделирования 10 случайных бросков игральной кости, следующие:

Как видите, частотные вероятности, полученные при моделировании всего десяти бросков, не похожи на теоретические вероятности.
Но по мере увеличения количества экспериментов эти две метрики становятся более похожими, посмотрите на симуляцию 100 запусков:

Теперь вероятность частоты, рассчитанная для каждого числа на игральной кости, больше похожа на его теоретическую вероятность, однако мы все равно получаем очень разные значения.
Наконец, мы проделываем ту же процедуру, но моделируем 1000 запусков:

Как мы видим из последней таблицы, теперь значения частотных вероятностей очень близки к теоретическим вероятностям.
Таким образом, чем больше мы увеличиваем количество проводимых экспериментов, тем больше значение частотной вероятности события приближается к его теоретической вероятности возникновения. Поэтому соблюдается закон больших чисел , ведь чем больше итераций мы выполняем, тем больше экспериментальные значения похожи на теоретические.
Ограничение закона больших чисел
Закон больших чисел справедлив в подавляющем большинстве случаев, однако некоторые типы распределений вероятностей не удовлетворяют этой статистической теореме.
Например, распределение Коши или распределение Парето (α<1) не сходятся по мере увеличения количества испытаний. Это связано с большими хвостами распределений, а это означает, что они не имеют ожидаемого значения.
С другой стороны, некоторые эксперименты являются предвзятыми в силу своих характеристик, так что исследователь склонен модифицировать результаты (намеренно или нет) в пользу рациональных, психологических, экономических и т. д. причины. В этих случаях закон больших чисел не помогает устранить систематическую ошибку, но систематическая ошибка будет сохраняться независимо от увеличения количества испытаний.
Закон больших чисел и центральная предельная теорема
Закон больших чисел и центральная предельная теорема — два тесно связанных между собой фундаментальных закона вероятности и статистики. Итак, в этом разделе мы увидим, каковы их отношения и в чем их разница.
Центральная предельная теорема, также называемая центральной предельной теоремой, гласит, что распределение выборочных средних приближается к нормальному распределению по мере увеличения размера выборки, независимо от распределения вероятностей генеральной совокупности.
Разница между законом больших чисел и центральной предельной теоремой заключается в том, что закон больших чисел утверждает, что среднее значение большого числа испытаний близко к ожидаемому значению, а центральная предельная теорема утверждает, что среднее значение многих из выборки приближаются к нормальному распределению.