Распределение пуассона или нормальное распределение: в чем разница?


Распределение Пуассона и нормальное распределение — два наиболее часто используемых распределения вероятностей в статистике.

В этом руководстве представлено краткое объяснение каждого дистрибутива, а также два ключевых различия между ними.

Обзор: распределение Пуассона

Распределение Пуассона описывает вероятность получения k успехов в течение заданного интервала времени.

Если случайная величина X подчиняется распределению Пуассона, то вероятность того, что X = k успеха, можно найти по следующей формуле:

P(X=k) = λ k * e – λ / k!

Золото:

  • λ: среднее количество успехов, произошедших за определенный интервал.
  • k: количество успехов
  • е: константа, равная примерно 2,71828

Например, предположим, что в конкретной больнице в среднем рождаются 2 ребенка в час. Мы можем использовать приведенную выше формулу, чтобы определить вероятность рождения трех детей в течение часа:

P(X=3) = 2 3 * e – 2/3 ! = 0,1805

Вероятность рождения трех детей в течение часа равна 0,1805 .

Обзор: нормальное распределение

Нормальное распределение описывает вероятность того, что случайная величина примет значение в заданном интервале.

Функцию плотности вероятности нормального распределения можно записать как:

P(X=x) = (1/σ√ )e -1/2((x-μ)/σ) 2

Золото:

  • σ: стандартное отклонение распределения.
  • μ: среднее значение распределения
  • x: значение случайной величины

Например, предположим, что вес определенного вида выдр обычно распределяется следующим образом: ц = 40 фунтов и σ = 5 фунтов.

Если мы случайным образом выберем выдру из этой популяции, мы сможем использовать следующую формулу, чтобы найти вероятность того, что она весит от 38 до 42 фунтов:

Р ( 38 < /5) 2 = 0,3108

Вероятность того, что случайно выбранная выдра весит от 38 до 42 фунтов, равна 0,3108 .

Отличие №1: Сдержанный и Непрерывные данные

Первое различие между распределением Пуассона и нормальным распределением — это тип данных, моделируемых каждым распределением вероятностей.

Распределение Пуассона используется при работе с дискретными данными , которые могут принимать только целочисленные значения, равные или большие нуля. Вот некоторые примеры:

  • Количество звонков, поступивших в час в колл-центр
  • Количество клиентов в день в ресторане
  • Количество дорожно-транспортных происшествий в месяц

В каждом сценарии случайная величина может принимать только значения 0, 1, 2, 3 и т. д.

Нормальное распределение используется при работе с непрерывными данными , которые могут принимать любое значение от отрицательной бесконечности до положительной бесконечности. Вот некоторые примеры:

  • Вес определенного животного
  • Высота определенного растения
  • Время женского марафона
  • Температура по Цельсию

В этих сценариях случайные величины могут принимать любое значение, например -11,3, 21,343435, 85 и т. д.

Отличие №2: форма распределений

Второе отличие распределения Пуассона от нормального распределения заключается в форме распределений.

Нормальное распределение всегда будет иметь колоколообразную форму:

Однако форма распределения Пуассона меняется в зависимости от среднего значения распределения.

Например, распределение Пуассона с небольшим значением среднего, например μ = 3 , будет сильно искажено вправо :

Однако распределение Пуассона с большим средним значением, например μ = 20 , будет иметь колоколообразную форму, как и нормальное распределение:

Обратите внимание, что нижняя граница распределения Пуассона всегда будет равна нулю, независимо от значения среднего, поскольку распределение Пуассона можно использовать только с целочисленными значениями, равными или большими нуля.

Дополнительные ресурсы

Следующие руководства предоставляют дополнительную информацию о распределении Пуассона:

Введение в распределение Пуассона
Четыре гипотезы распределения Пуассона
5 конкретных примеров распределения Пуассона

Следующие руководства предоставляют дополнительную информацию о нормальном распределении:

Введение в нормальное распределение
6 конкретных примеров нормального распределения
Генератор набора данных нормального распределения

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *