Come calcolare la probabilità condizionale in excel


La probabilità condizionata che si verifichi l’evento A , dato che si è verificato l’evento B , si calcola come segue:

P(A|B) = P(A∩B) / P(B)

Oro:

P(A∩B) = la probabilità che si verifichino entrambi l’evento A e l’evento B.

P(B) = la probabilità che si verifichi l’evento B.

Questa formula è particolarmente utile quando si calcolano le probabilità per una tabella a due vie, ovvero una tabella che visualizza le frequenze (o “conteggi”) per due variabili categoriali.

Ad esempio, la seguente tabella a due vie mostra i risultati di un sondaggio in cui è stato chiesto a 300 persone quale sport preferissero: baseball, basket, football o calcio. Le righe mostrano il sesso dell’intervistato e le colonne indicano lo sport scelto:

Esempio di tabella di frequenza bidirezionale in Excel

Questa è una tabella a doppio senso perché abbiamo due variabili categoriali : genere e sport preferito.

Mostreremo quindi come calcolare le probabilità condizionali per le tabelle a due vie in Excel.

Come calcolare la probabilità condizionale in Excel

Supponiamo di voler rispondere a domande del tipo:

“Quanto è probabile che un intervistato sia maschio, dato che il suo sport preferito è il baseball?” »

Possiamo trovare la risposta utilizzando la formula della probabilità condizionata:

P(maschile|baseball) = P(maschile∩baseball) / P(baseball) = (34/300) / (68/300) = 0,5

Pertanto, la probabilità che un intervistato sia un uomo, dato che il suo sport preferito è il baseball, è pari a 0,5 (o 50%).

Possiamo calcolare le probabilità condizionali per altri scenari nella tabella utilizzando una formula simile. L’immagine seguente mostra come calcolare ciascuna probabilità condizionata nella tabella, insieme alla formula utilizzata:

Probabilità condizionali in Excel

Si noti che per ogni calcolo della probabilità condizionata, utilizziamo semplicemente la formula della probabilità condizionata P(A|B) = P(A∩B) / P(B).

Ad esempio, la probabilità che lo sport preferito di un intervistato sia il calcio, dato che è una donna, viene calcolata come segue:

P(calcio|femminile) = P(calcio∩femminile) / P(femminile)

Dei 300 intervistati, ce ne sono esattamente 44 che sono donne e preferiscono il calcio come sport preferito, quindi P(calcio∩femminile) = 44/300.

E su 300 intervistati, 150 sono donne, quindi P(femmina) = 150/300.

Pertanto, P(calcio|femminile) = P(calcio∩femminile) / P(femminile) = (44/300) / (150/300) = 0,2933 .

Eseguiamo un calcolo simile per ogni scenario di probabilità condizionale.

Risorse addizionali

Come trovare la frequenza relativa condizionale in una tabella a doppia entrata
Che cos’è una distribuzione condizionale nelle statistiche?

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *