Come calcolare la probabilità condizionale in python
La probabilità condizionata che si verifichi l’evento A , dato che si è verificato l’evento B , si calcola come segue:
P(A|B) = P(A∩B) / P(B)
Oro:
P(A∩B) = la probabilità che si verifichino entrambi l’evento A e l’evento B.
P(B) = la probabilità che si verifichi l’evento B.
L’esempio seguente mostra come utilizzare questa formula per calcolare le probabilità condizionali in Python.
Esempio: calcola la probabilità condizionale in Python
Supponiamo di inviare un sondaggio a 300 persone chiedendo loro quale sport preferiscono: baseball, basket, calcio o calcio.
Possiamo creare la seguente tabella in Python per contenere le risposte al sondaggio:
import pandas as pd
import numpy as np
#create pandas DataFrame with raw data
df = pd. DataFrame ({' gender ': np. repeat (np. array (['Male', 'Female']), 150),
' sport ': np. repeat (np. array (['Baseball', 'Basketball', 'Football',
'Soccer', 'Baseball', 'Basketball',
'Football', 'Soccer']),
(34, 40, 58, 18, 34, 52, 20, 44))})
#produce contingency table to summarize raw data
survey_data = pd. crosstab (index=df[' gender '], columns=df[' sport '], margins= True )
#view contingency table
survey_data
sport Baseball Basketball Football Soccer All
gender
Female 34 52 20 44 150
Male 34 40 58 18 150
All 68 92 78 62 300
Correlati : Come utilizzare pd.crosstab() per creare tabelle di contingenza in Python
Possiamo utilizzare la seguente sintassi per estrarre i valori dall’array:
#extract value in second row and first column
survey_data. iloc [1, 0]
[1] 34
Possiamo utilizzare la seguente sintassi per calcolare la probabilità che un individuo sia maschio, dato che preferisce il baseball come sport preferito:
#calculate probability of being male, given that individual prefers baseball
survey_data. iloc [1, 0]/survey_data. iloc [2, 0]
0.5
E possiamo usare la seguente sintassi per calcolare la probabilità che un individuo preferisca il basket come sport preferito, dato che è donna:
#calculate probability of preferring basketball, given that individual is female
survey_data. iloc [0,1]/survey_data. iloc [0, 4]
0.3466666666666667
Possiamo utilizzare questo approccio di base per calcolare qualsiasi probabilità condizionata che desideriamo dalla tabella di contingenza.
Risorse addizionali
Le seguenti esercitazioni forniscono informazioni aggiuntive sulla gestione della probabilità:
Legge della probabilità totale
Come trovare la media di una distribuzione di probabilità
Come trovare la deviazione standard di una distribuzione di probabilità