Распределение пуассона или нормальное распределение: в чем разница?
Распределение Пуассона и нормальное распределение — два наиболее часто используемых распределения вероятностей в статистике.
В этом руководстве представлено краткое объяснение каждого дистрибутива, а также два ключевых различия между ними.
Обзор: распределение Пуассона
Распределение Пуассона описывает вероятность получения k успехов в течение заданного интервала времени.
Если случайная величина X подчиняется распределению Пуассона, то вероятность того, что X = k успеха, можно найти по следующей формуле:
P(X=k) = λ k * e – λ / k!
Золото:
- λ: среднее количество успехов, произошедших за определенный интервал.
- k: количество успехов
- е: константа, равная примерно 2,71828
Например, предположим, что в конкретной больнице в среднем рождаются 2 ребенка в час. Мы можем использовать приведенную выше формулу, чтобы определить вероятность рождения трех детей в течение часа:
P(X=3) = 2 3 * e – 2/3 ! = 0,1805
Вероятность рождения трех детей в течение часа равна 0,1805 .
Обзор: нормальное распределение
Нормальное распределение описывает вероятность того, что случайная величина примет значение в заданном интервале.
Функцию плотности вероятности нормального распределения можно записать как:
P(X=x) = (1/σ√ 2π )e -1/2((x-μ)/σ) 2
Золото:
- σ: стандартное отклонение распределения.
- μ: среднее значение распределения
- x: значение случайной величины
Например, предположим, что вес определенного вида выдр обычно распределяется следующим образом: ц = 40 фунтов и σ = 5 фунтов.
Если мы случайным образом выберем выдру из этой популяции, мы сможем использовать следующую формулу, чтобы найти вероятность того, что она весит от 38 до 42 фунтов:
Р ( 38 < /5) 2 = 0,3108
Вероятность того, что случайно выбранная выдра весит от 38 до 42 фунтов, равна 0,3108 .
Отличие №1: Сдержанный и Непрерывные данные
Первое различие между распределением Пуассона и нормальным распределением — это тип данных, моделируемых каждым распределением вероятностей.
Распределение Пуассона используется при работе с дискретными данными , которые могут принимать только целочисленные значения, равные или большие нуля. Вот некоторые примеры:
- Количество звонков, поступивших в час в колл-центр
- Количество клиентов в день в ресторане
- Количество дорожно-транспортных происшествий в месяц
В каждом сценарии случайная величина может принимать только значения 0, 1, 2, 3 и т. д.
Нормальное распределение используется при работе с непрерывными данными , которые могут принимать любое значение от отрицательной бесконечности до положительной бесконечности. Вот некоторые примеры:
- Вес определенного животного
- Высота определенного растения
- Время женского марафона
- Температура по Цельсию
В этих сценариях случайные величины могут принимать любое значение, например -11,3, 21,343435, 85 и т. д.
Отличие №2: форма распределений
Второе отличие распределения Пуассона от нормального распределения заключается в форме распределений.
Нормальное распределение всегда будет иметь колоколообразную форму:

Однако форма распределения Пуассона меняется в зависимости от среднего значения распределения.
Например, распределение Пуассона с небольшим значением среднего, например μ = 3 , будет сильно искажено вправо :

Однако распределение Пуассона с большим средним значением, например μ = 20 , будет иметь колоколообразную форму, как и нормальное распределение:

Обратите внимание, что нижняя граница распределения Пуассона всегда будет равна нулю, независимо от значения среднего, поскольку распределение Пуассона можно использовать только с целочисленными значениями, равными или большими нуля.
Дополнительные ресурсы
Следующие руководства предоставляют дополнительную информацию о распределении Пуассона:
Введение в распределение Пуассона
Четыре гипотезы распределения Пуассона
5 конкретных примеров распределения Пуассона
Следующие руководства предоставляют дополнительную информацию о нормальном распределении:
Введение в нормальное распределение
6 конкретных примеров нормального распределения
Генератор набора данных нормального распределения