Come calcolare la probabilità condizionale in excel
La probabilità condizionata che si verifichi l’evento A , dato che si è verificato l’evento B , si calcola come segue:
P(A|B) = P(A∩B) / P(B)
Oro:
P(A∩B) = la probabilità che si verifichino entrambi l’evento A e l’evento B.
P(B) = la probabilità che si verifichi l’evento B.
Questa formula è particolarmente utile quando si calcolano le probabilità per una tabella a due vie, ovvero una tabella che visualizza le frequenze (o “conteggi”) per due variabili categoriali.
Ad esempio, la seguente tabella a due vie mostra i risultati di un sondaggio in cui è stato chiesto a 300 persone quale sport preferissero: baseball, basket, football o calcio. Le righe mostrano il sesso dell’intervistato e le colonne indicano lo sport scelto:
Questa è una tabella a doppio senso perché abbiamo due variabili categoriali : genere e sport preferito.
Mostreremo quindi come calcolare le probabilità condizionali per le tabelle a due vie in Excel.
Come calcolare la probabilità condizionale in Excel
Supponiamo di voler rispondere a domande del tipo:
“Quanto è probabile che un intervistato sia maschio, dato che il suo sport preferito è il baseball?” »
Possiamo trovare la risposta utilizzando la formula della probabilità condizionata:
P(maschile|baseball) = P(maschile∩baseball) / P(baseball) = (34/300) / (68/300) = 0,5
Pertanto, la probabilità che un intervistato sia un uomo, dato che il suo sport preferito è il baseball, è pari a 0,5 (o 50%).
Possiamo calcolare le probabilità condizionali per altri scenari nella tabella utilizzando una formula simile. L’immagine seguente mostra come calcolare ciascuna probabilità condizionata nella tabella, insieme alla formula utilizzata:
Si noti che per ogni calcolo della probabilità condizionata, utilizziamo semplicemente la formula della probabilità condizionata P(A|B) = P(A∩B) / P(B).
Ad esempio, la probabilità che lo sport preferito di un intervistato sia il calcio, dato che è una donna, viene calcolata come segue:
P(calcio|femminile) = P(calcio∩femminile) / P(femminile)
Dei 300 intervistati, ce ne sono esattamente 44 che sono donne e preferiscono il calcio come sport preferito, quindi P(calcio∩femminile) = 44/300.
E su 300 intervistati, 150 sono donne, quindi P(femmina) = 150/300.
Pertanto, P(calcio|femminile) = P(calcio∩femminile) / P(femminile) = (44/300) / (150/300) = 0,2933 .
Eseguiamo un calcolo simile per ogni scenario di probabilità condizionale.
Risorse addizionali
Come trovare la frequenza relativa condizionale in una tabella a doppia entrata
Che cos’è una distribuzione condizionale nelle statistiche?