Что такое функция массы вероятности (pmf) в статистике?
Функция вероятностной массы , часто сокращенно PMF , сообщает нам вероятность того, что дискретная случайная величина примет определенное значение.
Например, предположим, что мы один раз бросаем игральную кость. Если мы обозначим x число, на которое выпадет кубик, то вероятность того, что x будет равен разным значениям, можно описать следующим образом:
- Р(Х=1): 1/6
- Р(Х=2): 1/6
- Р(Х=3): 1/6
- Р(Х=4): 1/6
- Р(Х=5): 1/6
- Р(Х=6): 1/6
Существует равная вероятность того, что на кубике выпадет любое число от 1 до 6.
Вот как мы могли бы записать эти вероятности в виде функции массы вероятности:
В левой части диаграммы показана вероятность, связанная с исходами в правой части:
Характеристика функции массы вероятности заключается в том, что сумма всех вероятностей должна быть равна 1. Вы заметите, что эта PMF удовлетворяет этому условию:
Сумма вероятностей = 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1.
Поддержка функции вероятностной массы относится к набору значений, которые может принимать дискретная случайная величина. В этом примере поддержкой будет {1, 2, 3, 4, 5, 6}, поскольку значение кубика может принимать любое из этих значений.
Вне поддержки значение PMF равно нулю. Например, вероятность того, что на кубике выпадет число «0», «7» или «8», равна нулю, поскольку ни одно из этих чисел не включено в скобку.
Функции вероятностной массы на практике
Два наиболее распространенных на практике примера функций массы вероятности касаются биномиального распределения и распределения Пуассона .
Биномиальное распределение
Если случайная величина X имеет биномиальное распределение, то вероятность того, что X = k успеха, можно найти по следующей формуле:
P(X=k) = n C k * p k * (1-p) nk
Золото:
- n: количество испытаний
- k: количество успехов
- p: вероятность успеха в данном испытании
- n C k : количество способов добиться k успехов в n испытаниях.
Например, предположим, что мы подбрасываем монету 3 раза. Мы можем использовать приведенную выше формулу, чтобы определить вероятность выпадения 0, 1, 2 и 3 решек при этих трех бросках:
- P(X=0) = 3 C 0 * 0,5 0 * (1-0,5) 3-0 = 1 * 1 * (0,5) 3 = 0,125
- P(X=1) = 3 C 1 * 0,5 1 * (1-0,5) 3-1 = 1 * 1 * (0,5) 2 = 0,375
- P(X=2) = 3 C 2 * 0,5 2 * (1-0,5) 3-2 = 1 * 1 * (0,5) 1 = 0,375
- P(X=3) = 3 C 3 * 0,5 3 * (1-0,5) 3-3 = 1 * 1 * (0,5) 0 = 0,125
Раздача рыбы
Если случайная величина X подчиняется распределению Пуассона, то вероятность того, что X = k успеха, можно найти по следующей формуле:
P(X=k) = λ k * e – λ / k!
Золото:
- λ: среднее количество успехов, произошедших за определенный интервал.
- k: количество успехов
- е: константа, равная примерно 2,71828
Например, предположим, что в конкретной больнице в среднем рождаются 2 ребенка в час. Мы можем использовать приведенную выше формулу, чтобы определить вероятность рождения 0, 1, 2, 3 и т. д. в данный час:
- P(X=0) = 2 0 * e – 2/0 ! = 0,1353
- P(X=1) = 2 1 * e – 2/1 ! = 0,2707
- P(X=2) = 2 2 * e – 2/2 ! = 0,2707
- P(X=3) = 2 3 * e – 2/3 ! = 0,1805
Просмотр PMF
Мы часто визуализируем массовые функции вероятности с помощью гистограмм.
Например, на следующей гистограмме показаны вероятности, связанные с числом рождений в час для распределения Пуассона, описанного в предыдущем примере:
Обратите внимание, что число рождений может достигать бесконечности, но после 10 вероятности становятся настолько малы, что их даже невозможно увидеть на гистограмме.
Свойства PMF
Функция массы вероятности обладает следующими свойствами:
1. Все вероятности положительны в поддержку. Например, вероятность того, что на кубике выпадет число от 1 до 6, положительна, а вероятность всех остальных исходов равна нулю.
2. Все исходы имеют вероятность от 0 до 1. Например, вероятность того, что игральная кость выпадет между 1 и 6, равна 1/6, или 0,1666666 для каждого исхода.
3. Сумма всех вероятностей должна равняться 1. Например, сумма вероятностей выпадения на игральной кости определенного числа равна 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1. /6 = 1.
Дополнительные ресурсы
Что такое случайные величины?
CDF или PDF: в чем разница?
Введение в биномиальное распределение
Введение в распределение Пуассона