So berechnen sie die bedingte wahrscheinlichkeit in python


Die bedingte Wahrscheinlichkeit des Eintretens von Ereignis A , vorausgesetzt, dass Ereignis B eingetreten ist, wird wie folgt berechnet:

P(A|B) = P(A∩B) / P(B)

Gold:

P(A∩B) = die Wahrscheinlichkeit, dass Ereignis A und Ereignis B beide eintreten.

P(B) = die Wahrscheinlichkeit, dass Ereignis B eintritt.

Das folgende Beispiel zeigt, wie diese Formel zur Berechnung bedingter Wahrscheinlichkeiten in Python verwendet wird.

Beispiel: Berechnen Sie die bedingte Wahrscheinlichkeit in Python

Nehmen wir an, wir senden eine Umfrage an 300 Personen und fragen sie, welche Sportart sie bevorzugen: Baseball, Basketball, Fußball oder Fußball.

Wir können die folgende Tabelle in Python erstellen, um die Umfrageantworten zu speichern:

 import pandas as pd
import numpy as np

#create pandas DataFrame with raw data
df = pd. DataFrame ({' gender ': np. repeat (np. array (['Male', 'Female']), 150),
                   ' sport ': np. repeat (np. array (['Baseball', 'Basketball', 'Football',
                                                'Soccer', 'Baseball', 'Basketball',
                                                'Football', 'Soccer']), 
                                    (34, 40, 58, 18, 34, 52, 20, 44))})

#produce contingency table to summarize raw data
survey_data = pd. crosstab (index=df[' gender '], columns=df[' sport '], margins= True )

#view contingency table
survey_data

sport Baseball Basketball Football Soccer All
gender					
Female 34 52 20 44 150
Male 34 40 58 18 150
All 68 92 78 62 300

Verwandte Themen : So verwenden Sie pd.crossstab() zum Erstellen von Kontingenztabellen in Python

Wir können die folgende Syntax verwenden, um die Werte aus dem Array zu extrahieren:

 #extract value in second row and first column 
survey_data. iloc [1, 0]

[1] 34

Wir können die folgende Syntax verwenden, um die Wahrscheinlichkeit zu berechnen, dass eine Person männlich ist, vorausgesetzt, sie bevorzugt Baseball als ihren Lieblingssport:

 #calculate probability of being male, given that individual prefers baseball
survey_data. iloc [1, 0]/survey_data. iloc [2, 0]

0.5

Und wir können die folgende Syntax verwenden, um die Wahrscheinlichkeit zu berechnen, dass eine Person Basketball als ihre Lieblingssportart bevorzugt, vorausgesetzt, sie ist weiblich:

 #calculate probability of preferring basketball, given that individual is female
survey_data. iloc [0,1]/survey_data. iloc [0, 4]

0.3466666666666667

Mit diesem grundlegenden Ansatz können wir jede gewünschte bedingte Wahrscheinlichkeit aus der Kontingenztabelle berechnen.

Zusätzliche Ressourcen

Die folgenden Tutorials bieten zusätzliche Informationen zum Wahrscheinlichkeitsmanagement:

Gesetz der Gesamtwahrscheinlichkeit
So ermitteln Sie den Mittelwert einer Wahrscheinlichkeitsverteilung
So ermitteln Sie die Standardabweichung einer Wahrscheinlichkeitsverteilung

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert