Come calcolare la probabilità condizionale in python


La probabilità condizionata che si verifichi l’evento A , dato che si è verificato l’evento B , si calcola come segue:

P(A|B) = P(A∩B) / P(B)

Oro:

P(A∩B) = la probabilità che si verifichino entrambi l’evento A e l’evento B.

P(B) = la probabilità che si verifichi l’evento B.

L’esempio seguente mostra come utilizzare questa formula per calcolare le probabilità condizionali in Python.

Esempio: calcola la probabilità condizionale in Python

Supponiamo di inviare un sondaggio a 300 persone chiedendo loro quale sport preferiscono: baseball, basket, calcio o calcio.

Possiamo creare la seguente tabella in Python per contenere le risposte al sondaggio:

 import pandas as pd
import numpy as np

#create pandas DataFrame with raw data
df = pd. DataFrame ({' gender ': np. repeat (np. array (['Male', 'Female']), 150),
                   ' sport ': np. repeat (np. array (['Baseball', 'Basketball', 'Football',
                                                'Soccer', 'Baseball', 'Basketball',
                                                'Football', 'Soccer']), 
                                    (34, 40, 58, 18, 34, 52, 20, 44))})

#produce contingency table to summarize raw data
survey_data = pd. crosstab (index=df[' gender '], columns=df[' sport '], margins= True )

#view contingency table
survey_data

sport Baseball Basketball Football Soccer All
gender					
Female 34 52 20 44 150
Male 34 40 58 18 150
All 68 92 78 62 300

Correlati : Come utilizzare pd.crosstab() per creare tabelle di contingenza in Python

Possiamo utilizzare la seguente sintassi per estrarre i valori dall’array:

 #extract value in second row and first column 
survey_data. iloc [1, 0]

[1] 34

Possiamo utilizzare la seguente sintassi per calcolare la probabilità che un individuo sia maschio, dato che preferisce il baseball come sport preferito:

 #calculate probability of being male, given that individual prefers baseball
survey_data. iloc [1, 0]/survey_data. iloc [2, 0]

0.5

E possiamo usare la seguente sintassi per calcolare la probabilità che un individuo preferisca il basket come sport preferito, dato che è donna:

 #calculate probability of preferring basketball, given that individual is female
survey_data. iloc [0,1]/survey_data. iloc [0, 4]

0.3466666666666667

Possiamo utilizzare questo approccio di base per calcolare qualsiasi probabilità condizionata che desideriamo dalla tabella di contingenza.

Risorse addizionali

Le seguenti esercitazioni forniscono informazioni aggiuntive sulla gestione della probabilità:

Legge della probabilità totale
Come trovare la media di una distribuzione di probabilità
Come trovare la deviazione standard di una distribuzione di probabilità

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *