Что такое совместное распределение вероятностей?


Двусторонняя таблица частот — это таблица, в которой отображаются частоты (или «счетчики») для двух категориальных переменных.

Например, в следующей двусторонней таблице показаны результаты опроса 100 человек, какой вид спорта они предпочитают: бейсбол, баскетбол или футбол.

В строках указан пол респондента, а в столбцах указан вид спорта, который он выбирает:

В этом примере есть две переменные: Спорт и Пол.

Совместное распределение вероятностей просто описывает вероятность того, что данный человек примет два конкретных значения переменных.

Слово «сочетание» происходит от того факта, что нас интересует вероятность того, что два события произойдут одновременно.

Например, из 100 человек 13 были мужчинами и выбрали бейсбол своим любимым видом спорта.

Итак, мы бы сказали, что общая вероятность того, что данный человек — мужчина и выберет бейсбол в качестве своего любимого вида спорта, равна 13/100 = 0,13 или 13% .

Записано в математической записи:

P(Пол = Мужской, Спорт = Бейсбол) = 13/100 = 0,13 .

Мы можем использовать этот процесс для расчета всего совместного распределения вероятностей:

  • P (Пол = Мужской, Спорт = Бейсбол) = 13/100 = 0,13
  • P(Пол = Мужской, Спорт = Баскетбол) = 15/100 = 0,15
  • P(Пол = Мужской, Спорт = Футбол) = 20/100 = 0,20
  • P (Пол = Женский, Спорт = Бейсбол) = 23/100 = 0,23
  • P(Пол = Женский, Спорт = Баскетбол) = 16/100 = 0,16
  • P(Пол = Женский, Спорт = Футбол) = 13/100 = 0,13

Обратите внимание, что сумма вероятностей равна 1 или 100% .

Зачем использовать совместное распределение вероятностей?

Совместные распределения вероятностей полезны, потому что мы часто собираем данные для двух переменных (например, спорта и пола) и хотим ответить на вопросы, связанные с обеими переменными.

Например, мы можем захотеть понять вероятность того, что данный человек в популяции является мужчиной и предпочитает бейсбол как свой любимый вид спорта.

Или нам может быть интересно понять вероятность того, что данный человек — женщина и предпочитает футбол как свой любимый вид спорта.

Совместное распределение вероятностей может помочь нам ответить на эти вопросы.

Используйте следующие примеры в качестве практики, чтобы лучше понять совместные распределения вероятностей.

Пример 1

В следующей двусторонней таблице представлены результаты опроса, в котором 238 человек спрашивали, какой фильм они предпочитают:

Пример предельного распределения с двусторонней таблицей

Вопрос: Какова вероятность того, что данный человек — женщина и предпочитает драму как свой любимый жанр кино?

Ответ: P (Пол = Женский, Пол = Драма) = 58/238 = 0,244 = 24,4%

Пример 2

В следующей двусторонней таблице показаны результаты экзаменов 64 учеников класса в зависимости от количества часов, которые они потратили на обучение:

Пример предельного распределения

Вопрос: Какова вероятность того, что данный человек проработает 2 часа и получит оценку от 91 до 100?

Ответ: P (Обучение = 2 часа, Оценка = 91-100) = 3/64 = 0,047 = 4,7%

Дополнительные ресурсы

Что такое маргинальное распределение?
Как найти условную относительную частоту в таблице двойной записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *