Hoe voorwaardelijke waarschijnlijkheid in python te berekenen


De voorwaardelijke waarschijnlijkheid dat gebeurtenis A plaatsvindt, gegeven dat gebeurtenis B heeft plaatsgevonden, wordt als volgt berekend:

P(A|B) = P(A∩B) / P(B)

Goud:

P(A∩B) = de waarschijnlijkheid dat gebeurtenis A en gebeurtenis B beide plaatsvinden.

P(B) = de waarschijnlijkheid dat gebeurtenis B zal plaatsvinden.

In het volgende voorbeeld ziet u hoe u deze formule kunt gebruiken om voorwaardelijke kansen in Python te berekenen.

Voorbeeld: Bereken de voorwaardelijke waarschijnlijkheid in Python

Laten we zeggen dat we een enquête naar 300 mensen sturen met de vraag welke sport ze het liefste beoefenen: honkbal, basketbal, voetbal of voetbal.

We kunnen de volgende tabel in Python maken om de enquêtereacties in op te slaan:

 import pandas as pd
import numpy as np

#create pandas DataFrame with raw data
df = pd. DataFrame ({' gender ': np. repeat (np. array (['Male', 'Female']), 150),
                   ' sport ': np. repeat (np. array (['Baseball', 'Basketball', 'Football',
                                                'Soccer', 'Baseball', 'Basketball',
                                                'Football', 'Soccer']), 
                                    (34, 40, 58, 18, 34, 52, 20, 44))})

#produce contingency table to summarize raw data
survey_data = pd. crosstab (index=df[' gender '], columns=df[' sport '], margins= True )

#view contingency table
survey_data

sport Baseball Basketball Football Soccer All
gender					
Female 34 52 20 44 150
Male 34 40 58 18 150
All 68 92 78 62 300

Gerelateerd : Hoe pd.crosstab() te gebruiken om contingentietabellen te maken in Python

We kunnen de volgende syntaxis gebruiken om de waarden uit de array te extraheren:

 #extract value in second row and first column 
survey_data. iloc [1, 0]

[1] 34

We kunnen de volgende syntaxis gebruiken om de waarschijnlijkheid te berekenen dat een individu een man is, gegeven het feit dat hij honkbal als zijn favoriete sport verkiest:

 #calculate probability of being male, given that individual prefers baseball
survey_data. iloc [1, 0]/survey_data. iloc [2, 0]

0.5

En we kunnen de volgende syntaxis gebruiken om de waarschijnlijkheid te berekenen dat een individu basketbal als favoriete sport verkiest, gegeven het feit dat hij of zij een vrouw is:

 #calculate probability of preferring basketball, given that individual is female
survey_data. iloc [0,1]/survey_data. iloc [0, 4]

0.3466666666666667

We kunnen deze basisbenadering gebruiken om elke gewenste voorwaardelijke waarschijnlijkheid uit de kruistabel te berekenen.

Aanvullende bronnen

De volgende tutorials bieden aanvullende informatie over kansbeheer:

Wet van de totale waarschijnlijkheid
Hoe het gemiddelde van een kansverdeling te vinden
Hoe de standaarddeviatie van een kansverdeling te vinden

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert