Jak obliczyć prawdopodobieństwo warunkowe w pythonie


Prawdopodobieństwo warunkowe zajścia zdarzenia A , przy założeniu, że zaszło zdarzenie B , oblicza się w następujący sposób:

P(A|B) = P(A∩B) / P(B)

Złoto:

P(A∩B) = prawdopodobieństwo wystąpienia zarówno zdarzenia A , jak i zdarzenia B.

P(B) = prawdopodobieństwo wystąpienia zdarzenia B.

Poniższy przykład pokazuje, jak używać tej formuły do obliczania prawdopodobieństw warunkowych w języku Python.

Przykład: Oblicz prawdopodobieństwo warunkowe w Pythonie

Załóżmy, że wysyłamy ankietę do 300 osób z pytaniem, jaki sport preferują: baseball, koszykówkę, piłkę nożną czy piłkę nożną.

Możemy utworzyć w Pythonie następującą tabelę do przechowywania odpowiedzi na ankietę:

 import pandas as pd
import numpy as np

#create pandas DataFrame with raw data
df = pd. DataFrame ({' gender ': np. repeat (np. array (['Male', 'Female']), 150),
                   ' sport ': np. repeat (np. array (['Baseball', 'Basketball', 'Football',
                                                'Soccer', 'Baseball', 'Basketball',
                                                'Football', 'Soccer']), 
                                    (34, 40, 58, 18, 34, 52, 20, 44))})

#produce contingency table to summarize raw data
survey_data = pd. crosstab (index=df[' gender '], columns=df[' sport '], margins= True )

#view contingency table
survey_data

sport Baseball Basketball Football Soccer All
gender					
Female 34 52 20 44 150
Male 34 40 58 18 150
All 68 92 78 62 300

Powiązane : Jak używać pd.crosstab() do tworzenia tabel awaryjnych w Pythonie

Aby wyodrębnić wartości z tablicy, możemy zastosować następującą składnię:

 #extract value in second row and first column 
survey_data. iloc [1, 0]

[1] 34

Możemy użyć następującej składni, aby obliczyć prawdopodobieństwo, że dana osoba jest mężczyzną, zakładając, że preferuje baseball jako swój ulubiony sport:

 #calculate probability of being male, given that individual prefers baseball
survey_data. iloc [1, 0]/survey_data. iloc [2, 0]

0.5

Możemy użyć następującej składni, aby obliczyć prawdopodobieństwo, że dana osoba woli koszykówkę jako swój ulubiony sport, biorąc pod uwagę, że jest kobietą:

 #calculate probability of preferring basketball, given that individual is female
survey_data. iloc [0,1]/survey_data. iloc [0, 4]

0.3466666666666667

Możemy zastosować to podstawowe podejście do obliczenia dowolnego prawdopodobieństwa warunkowego z tabeli kontyngencji.

Dodatkowe zasoby

Poniższe samouczki zawierają dodatkowe informacje na temat zarządzania prawdopodobieństwem:

Prawo całkowitego prawdopodobieństwa
Jak znaleźć średnią rozkładu prawdopodobieństwa
Jak znaleźć odchylenie standardowe rozkładu prawdopodobieństwa

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *