Как рассчитать условную вероятность в excel
Условная вероятность наступления события А при условии, что произошло событие Б , рассчитывается следующим образом:
P(A|B) = P(A∩B) / P(B)
Золото:
P(A∩B) = вероятность того, что произойдет событие A и событие B.
P(B) = вероятность того, что событие B произойдет.
Эта формула особенно полезна при расчете вероятностей для двусторонней таблицы, которая представляет собой таблицу, отображающую частоты (или «счетчики») для двух категориальных переменных.
Например, в следующей двусторонней таблице показаны результаты опроса 300 человек, какой вид спорта они предпочитают: бейсбол, баскетбол, футбол или футбол. В строках указан пол респондента, а в столбцах указан вид спорта, который он выбирает:
Это двусторонняя таблица, поскольку у нас есть две категориальные переменные : пол и любимый вид спорта.
Затем мы покажем, как рассчитать условные вероятности для двусторонних таблиц в Excel.
Как рассчитать условную вероятность в Excel
Предположим, мы хотим ответить на такие вопросы, как:
«Насколько вероятно, что респондент — мужчина, учитывая, что его любимый вид спорта — бейсбол?» »
Ответ можно найти, используя формулу условной вероятности:
P(мужской|бейсбол) = P(мужской∩бейсбол) / P(бейсбол) = (34/300) / (68/300) = 0,5
Таким образом, вероятность того, что респондент — мужчина, учитывая, что его любимый вид спорта — бейсбол, равна 0,5 (или 50%).
По аналогичной формуле можно рассчитать условные вероятности и для других сценариев из таблицы. На изображении ниже показано, как рассчитать каждую условную вероятность в таблице, а также использованную формулу:
Обратите внимание, что для каждого расчета условной вероятности мы просто используем формулу условной вероятности P(A|B) = P(A∩B)/P(B).
Например, вероятность того, что любимым видом спорта респондентки является футбол, учитывая, что она женщина, рассчитывается следующим образом:
P(футбол|женщина) = P(футбол∩женщина) / P(женщина)
Из 300 респондентов ровно 44 являются женщинами, которые предпочитают футбол своим любимым видом спорта, поэтому P(футбол∩женщина) = 44/300.
А из 300 респондентов 150 — женщины, поэтому P(женщины) = 150/300.
Таким образом, P(футбол|женщина) = P(футбол∩женщина) / P(женщина) = (44/300) / (150/300) = 0,2933 .
Аналогичный расчет мы выполняем для каждого сценария условной вероятности.
Дополнительные ресурсы
Как найти условную относительную частоту в таблице двойной записи
Что такое условное распределение в статистике?