Як обчислити умовну ймовірність у python


Умовна ймовірність настання події A , враховуючи, що подія B відбулася, обчислюється наступним чином:

P(A|B) = P(A∩B) / P(B)

золото:

P(A∩B) = ймовірність того, що події A та B відбудуться.

P(B) = ймовірність того, що подія B відбудеться.

У наступному прикладі показано, як використовувати цю формулу для обчислення умовних ймовірностей у Python.

Приклад: обчислення умовної ймовірності в Python

Припустімо, ми надішлемо опитування 300 людям із запитанням, якому виду спорту вони віддають перевагу: бейсболу, баскетболу, футболу чи футболу.

Ми можемо створити таку таблицю на Python для зберігання відповідей на опитування:

 import pandas as pd
import numpy as np

#create pandas DataFrame with raw data
df = pd. DataFrame ({' gender ': np. repeat (np. array (['Male', 'Female']), 150),
                   ' sport ': np. repeat (np. array (['Baseball', 'Basketball', 'Football',
                                                'Soccer', 'Baseball', 'Basketball',
                                                'Football', 'Soccer']), 
                                    (34, 40, 58, 18, 34, 52, 20, 44))})

#produce contingency table to summarize raw data
survey_data = pd. crosstab (index=df[' gender '], columns=df[' sport '], margins= True )

#view contingency table
survey_data

sport Baseball Basketball Football Soccer All
gender					
Female 34 52 20 44 150
Male 34 40 58 18 150
All 68 92 78 62 300

Пов’язане : Як використовувати pd.crosstab() для створення таблиць непередбачуваності в Python

Ми можемо використовувати такий синтаксис, щоб отримати значення з масиву:

 #extract value in second row and first column 
survey_data. iloc [1, 0]

[1] 34

Ми можемо використати наступний синтаксис, щоб обчислити ймовірність того, що особа чоловічої статі, враховуючи, що вона віддає перевагу бейсболу як своєму улюбленому виду спорту:

 #calculate probability of being male, given that individual prefers baseball
survey_data. iloc [1, 0]/survey_data. iloc [2, 0]

0.5

І ми можемо використати такий синтаксис, щоб обчислити ймовірність того, що людина віддає перевагу баскетболу як своєму улюбленому виду спорту, враховуючи, що вона жінка:

 #calculate probability of preferring basketball, given that individual is female
survey_data. iloc [0,1]/survey_data. iloc [0, 4]

0.3466666666666667

Ми можемо використовувати цей базовий підхід, щоб обчислити будь-яку умовну ймовірність, яку ми хочемо, з таблиці непередбачуваності.

Додаткові ресурси

Наступні посібники надають додаткову інформацію про керування ймовірністю:

Закон повної ймовірності
Як знайти середнє значення розподілу ймовірностей
Як знайти стандартне відхилення розподілу ймовірностей

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *