Cara menghitung probabilitas bersyarat dengan python
Probabilitas bersyarat terjadinya peristiwa A , jika peristiwa B telah terjadi, dihitung sebagai berikut:
P(A|B) = P(A∩B) / P(B)
Emas:
P(A∩B) = peluang terjadinya kejadian A dan kejadian B.
P(B) = peluang terjadinya kejadian B.
Contoh berikut menunjukkan cara menggunakan rumus ini untuk menghitung probabilitas bersyarat dengan Python.
Contoh: Hitung Probabilitas Bersyarat dengan Python
Katakanlah kita mengirimkan survei kepada 300 orang yang menanyakan olahraga apa yang mereka sukai: baseball, bola basket, sepak bola, atau sepak bola.
Kita dapat membuat tabel berikut dengan Python untuk menampung respons survei:
import pandas as pd
import numpy as np
#create pandas DataFrame with raw data
df = pd. DataFrame ({' gender ': np. repeat (np. array (['Male', 'Female']), 150),
' sport ': np. repeat (np. array (['Baseball', 'Basketball', 'Football',
'Soccer', 'Baseball', 'Basketball',
'Football', 'Soccer']),
(34, 40, 58, 18, 34, 52, 20, 44))})
#produce contingency table to summarize raw data
survey_data = pd. crosstab (index=df[' gender '], columns=df[' sport '], margins= True )
#view contingency table
survey_data
sport Baseball Basketball Football Soccer All
gender
Female 34 52 20 44 150
Male 34 40 58 18 150
All 68 92 78 62 300
Terkait : Cara Menggunakan pd.crosstab() untuk Membuat Tabel Kontingensi dengan Python
Kita dapat menggunakan sintaks berikut untuk mengekstrak nilai dari array:
#extract value in second row and first column
survey_data. iloc [1, 0]
[1] 34
Kita dapat menggunakan sintaks berikut untuk menghitung probabilitas bahwa seseorang adalah laki-laki, mengingat ia lebih memilih bisbol sebagai olahraga favoritnya:
#calculate probability of being male, given that individual prefers baseball
survey_data. iloc [1, 0]/survey_data. iloc [2, 0]
0.5
Dan kita dapat menggunakan sintaks berikut untuk menghitung probabilitas seseorang memilih bola basket sebagai olahraga favoritnya, mengingat dia adalah perempuan:
#calculate probability of preferring basketball, given that individual is female
survey_data. iloc [0,1]/survey_data. iloc [0, 4]
0.3466666666666667
Kita dapat menggunakan pendekatan dasar ini untuk menghitung probabilitas bersyarat apa pun yang kita inginkan dari tabel kontingensi.
Sumber daya tambahan
Tutorial berikut memberikan informasi tambahan tentang manajemen probabilitas:
Hukum probabilitas total
Bagaimana mencari mean dari distribusi probabilitas
Bagaimana mencari simpangan baku dari suatu distribusi probabilitas