Що таке умовний розподіл у статистиці?
Якщо X і Y є двома спільно розподіленими випадковими змінними , то умовний розподіл Y при заданому X є ймовірнісним розподілом Y , коли відомо, що X є певним значенням.
Наприклад, наступна двостороння таблиця показує результати опитування 100 людей, який вид спорту вони віддають перевагу: бейсбол, баскетбол чи футбол.
Якщо ми хочемо знати ймовірність того, що людина віддає перевагу певному виду спорту, враховуючи , що вона чоловік, то це приклад умовного розподілу.
Значення однієї випадкової величини відоме (людина — чоловік), але значення іншої випадкової величини невідоме (ми не знаємо її улюблений вид спорту).
Щоб знайти умовний розподіл спортивних переваг серед чоловіків, просто подивимося на значення лінії для чоловіків у таблиці:
Умовний розподіл буде розраховано таким чином:
- Чоловіки, які віддають перевагу бейсболу: 13/48 = 0,2708
- Чоловіки, які віддають перевагу баскетболу: 15/48 = 0,3125
- Чоловіки, які віддають перевагу футболу: 20/48 = 0,4167
Зверніть увагу, що сума ймовірностей дорівнює 1: 13/48 + 15/48 + 20/48 = 48/48 = 1.
Ми можемо використати цей умовний розподіл, щоб відповісти на такі запитання: враховуючи те, що особа чоловічої статі, яка ймовірність того, що бейсбол є її улюбленим видом спорту?
З умовного розподілу, який ми розрахували раніше, ми бачимо, що ймовірність становить 0,2708 .
Технічною мовою, коли ми обчислюємо умовний розподіл, ми говоримо, що нас цікавить певна субпопуляція загальної сукупності. Субпопуляція в попередньому прикладі складалася з чоловіків:
І коли ми хочемо обчислити ймовірність, пов’язану з цією субпопуляцією, ми говоримо, що нас цікавить певний цікавий символ . Цікавим персонажем у попередньому прикладі був бейсбол:
Щоб знайти ймовірність того, що цікава ознака з’являється в субпопуляції, ми просто ділимо значення цікавої ознаки (наприклад, 13) на загальні значення субпопуляції (наприклад, 48), щоб отримати 13/48 = 0,2708 .
Умовні розподіли та незалежність
Ми можемо сказати, що випадкові величини X і Y є незалежними тоді і тільки тоді, коли умовний розподіл Y , заданий X , для всіх можливих реалізацій X дорівнює безумовному розподілу Y.
Наприклад, у попередній таблиці чи можна побачити, що тести «надає перевагу бейсболу» та «чоловічому» є незалежними?
Щоб відповісти на це питання, розрахуємо такі ймовірності:
- P (надає перевагу бейсбол)
- P(prefers baseball | man) «надає перевагу бейсболу, враховуючи, що вони чоловіки
Імовірність того, що дана особа віддає перевагу бейсболу, становить:
- P (надає перевагу бейсболу) = 36/100 = 0,36 .
Імовірність того, що даний індивід віддає перевагу бейсболу, враховуючи, що він чоловік, становить
- P (надає перевагу бейсбол | чоловік) = 13/48 = 0,2708 .
Оскільки P(надає перевагу бейсболу) не дорівнює P(надає перевагу бейсболу | чоловік), випадкові змінні спортивних переваг і статі не є незалежними.
Навіщо використовувати умовні розподіли?
Умовні розподіли ймовірностей корисні, оскільки ми часто збираємо дані для двох змінних (наприклад, статі та спортивних уподобань), але ми хочемо відповісти на запитання про ймовірність, знаючи значення однієї зі змінних.
У попередньому прикладі ми розглядали сценарій, коли ми знали, що дана особа є чоловіком, і ми просто хотіли знати ймовірність того, що ця особа віддасть перевагу бейсболу.
У реальному житті є багато випадків, коли ми знаємо значення змінної та можемо використовувати умовний розподіл, щоб знайти ймовірність того, що інша змінна набере певного значення.
Додаткові ресурси
Що таке граничний розподіл?
Що таке спільний розподіл ймовірностей?
Як знайти умовну відносну частоту в таблиці подвійного запису