Python'da koşullu olasılık nasıl hesaplanır?
B olayının meydana geldiği dikkate alındığında, A olayının gerçekleşmesinin koşullu olasılığı aşağıdaki şekilde hesaplanır:
P(A|B) = P(A∩B) / P(B)
Altın:
P(A∩B) = A olayının ve B olayının her ikisinin de meydana gelme olasılığı.
P(B) = B olayının meydana gelme olasılığı.
Aşağıdaki örnek, Python’da koşullu olasılıkları hesaplamak için bu formülün nasıl kullanılacağını gösterir.
Örnek: Python’da Koşullu Olasılığı Hesaplama
Diyelim ki 300 kişiye hangi sporu tercih ettiklerini soran bir anket gönderdik: beyzbol, basketbol, futbol veya futbol.
Anket yanıtlarını tutmak için Python’da aşağıdaki tabloyu oluşturabiliriz:
import pandas as pd
import numpy as np
#create pandas DataFrame with raw data
df = pd. DataFrame ({' gender ': np. repeat (np. array (['Male', 'Female']), 150),
' sport ': np. repeat (np. array (['Baseball', 'Basketball', 'Football',
'Soccer', 'Baseball', 'Basketball',
'Football', 'Soccer']),
(34, 40, 58, 18, 34, 52, 20, 44))})
#produce contingency table to summarize raw data
survey_data = pd. crosstab (index=df[' gender '], columns=df[' sport '], margins= True )
#view contingency table
survey_data
sport Baseball Basketball Football Soccer All
gender
Female 34 52 20 44 150
Male 34 40 58 18 150
All 68 92 78 62 300
İlgili : Python’da Acil Durum Tabloları Oluşturmak için pd.crosstab() Nasıl Kullanılır
Diziden değerleri çıkarmak için aşağıdaki sözdizimini kullanabiliriz:
#extract value in second row and first column
survey_data. iloc [1, 0]
[1] 34
Bir bireyin en sevdiği spor olarak beyzbolu tercih ettiği göz önüne alındığında, erkek olma olasılığını hesaplamak için aşağıdaki sözdizimini kullanabiliriz:
#calculate probability of being male, given that individual prefers baseball
survey_data. iloc [1, 0]/survey_data. iloc [2, 0]
0.5
Bir kişinin kadın olduğu göz önüne alındığında, en sevdiği spor olarak basketbolu tercih etme olasılığını hesaplamak için aşağıdaki sözdizimini kullanabiliriz:
#calculate probability of preferring basketball, given that individual is female
survey_data. iloc [0,1]/survey_data. iloc [0, 4]
0.3466666666666667
Bu temel yaklaşımı, beklenmedik durum tablosundan istediğimiz herhangi bir koşullu olasılığı hesaplamak için kullanabiliriz.
Ek kaynaklar
Aşağıdaki eğitimler olasılık yönetimi hakkında ek bilgi sağlar:
Toplam olasılık yasası
Olasılık dağılımının ortalaması nasıl bulunur?
Olasılık dağılımının standart sapması nasıl bulunur?