Как рассчитать условную вероятность в excel


Условная вероятность наступления события А при условии, что произошло событие Б , рассчитывается следующим образом:

P(A|B) = P(A∩B) / P(B)

Золото:

P(A∩B) = вероятность того, что произойдет событие A и событие B.

P(B) = вероятность того, что событие B произойдет.

Эта формула особенно полезна при расчете вероятностей для двусторонней таблицы, которая представляет собой таблицу, отображающую частоты (или «счетчики») для двух категориальных переменных.

Например, в следующей двусторонней таблице показаны результаты опроса 300 человек, какой вид спорта они предпочитают: бейсбол, баскетбол, футбол или футбол. В строках указан пол респондента, а в столбцах указан вид спорта, который он выбирает:

Пример двунаправленной таблицы частот в Excel

Это двусторонняя таблица, поскольку у нас есть две категориальные переменные : пол и любимый вид спорта.

Затем мы покажем, как рассчитать условные вероятности для двусторонних таблиц в Excel.

Как рассчитать условную вероятность в Excel

Предположим, мы хотим ответить на такие вопросы, как:

«Насколько вероятно, что респондент — мужчина, учитывая, что его любимый вид спорта — бейсбол?» »

Ответ можно найти, используя формулу условной вероятности:

P(мужской|бейсбол) = P(мужской∩бейсбол) / P(бейсбол) = (34/300) / (68/300) = 0,5

Таким образом, вероятность того, что респондент — мужчина, учитывая, что его любимый вид спорта — бейсбол, равна 0,5 (или 50%).

По аналогичной формуле можно рассчитать условные вероятности и для других сценариев из таблицы. На изображении ниже показано, как рассчитать каждую условную вероятность в таблице, а также использованную формулу:

Условные вероятности в Excel

Обратите внимание, что для каждого расчета условной вероятности мы просто используем формулу условной вероятности P(A|B) = P(A∩B)/P(B).

Например, вероятность того, что любимым видом спорта респондентки является футбол, учитывая, что она женщина, рассчитывается следующим образом:

P(футбол|женщина) = P(футбол∩женщина) / P(женщина)

Из 300 респондентов ровно 44 являются женщинами, которые предпочитают футбол своим любимым видом спорта, поэтому P(футбол∩женщина) = 44/300.

А из 300 респондентов 150 — женщины, поэтому P(женщины) = 150/300.

Таким образом, P(футбол|женщина) = P(футбол∩женщина) / P(женщина) = (44/300) / (150/300) = 0,2933 .

Аналогичный расчет мы выполняем для каждого сценария условной вероятности.

Дополнительные ресурсы

Как найти условную относительную частоту в таблице двойной записи
Что такое условное распределение в статистике?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *