Tabella di contingenza
Questo articolo spiega cosa sono le tabelle di contingenza, come creare una tabella di contingenza e a cosa servono questi tipi di tabelle. Inoltre, troverai un esempio concreto di calcolo delle probabilità da una tabella di contingenza.
Cos’è una tabella di contingenza?
Una tabella di contingenza è un insieme di righe e colonne utilizzate per classificare i dati raccolti. Nelle statistiche, le tabelle di contingenza vengono utilizzate per calcolare le probabilità e analizzare le informazioni raccolte.
Per farti capire cos’è una tabella di contingenza, ecco un esempio dei risultati delle partite giocate da una squadra di calcio durante un’intera stagione espressi in una tabella di contingenza:
Come puoi vedere, le tabelle di contingenza sono molto utili per stratificare i dati. Ad esempio, grazie a questa tabella di contingenza sappiamo che la squadra ha vinto 19 partite delle 25 giocate in casa, inoltre ha giocato un totale di 50 partite.
Pertanto, realizzare una tabella di contingenza è molto semplice, è necessario prima condurre delle ricerche e raccogliere dati numerici sull’argomento in questione. Quindi ordina semplicemente i dati in base alla loro natura. Logicamente, è necessario avere ben chiare le variabili con cui classificare i dati per poterne dare una corretta interpretazione.
Attualmente esistono molti programmi per computer, come Excel o Minitab, che creano automaticamente tabelle di contingenza, cioè basta inserire i dati nel computer e dire le variabili nella tabella, con questo programma è in grado di classificare i dati in un tabella di contingenza ed eseguire calcoli statistici.
Esempio di tabella di contingenza
Una volta conosciuta la definizione di tabella di contingenza, vedremo un esercizio risolto per comprendere meglio il concetto.
Nella tabella di contingenza seguente sono stati raccolti i risultati di tutte le partite di una squadra di calcio nel corso di un’intera stagione. Da queste informazioni, calcola le seguenti probabilità:
- Per una data partita, qual è la probabilità marginale che la squadra perda?
- Qual è la probabilità congiunta di giocare in trasferta e vincere?
- Qual è la probabilità condizionata (o probabilità condizionata) di vincere se giochi in casa?
La tabella di contingenza per questo esercizio è 2×2, poiché ha due righe e due colonne.
Per calcolare una probabilità è necessario dividere il numero dei casi favorevoli all’evento per il numero totale dei casi possibili, ovvero la formula per il calcolo delle probabilità è:
Pertanto, alla prima domanda, calcolando la probabilità marginale di sconfitta, dobbiamo dividere il numero di sconfitte osservate (20) per il numero totale di partite (50):
In secondo luogo, per trovare la probabilità congiunta che la partita in trasferta e la vincita si verifichino nello stesso momento, è necessario dividere il numero di vincite avvenute durante la partita in trasferta (11) per il numero totale di casi (50):
Infine, per determinare la probabilità condizionata che la squadra vinca giocando in casa, dobbiamo calcolare il quoziente tra il numero di vittorie casalinghe (19) e il numero totale di partite giocate in casa (25):
Si noti che il calcolo delle probabilità non viene sempre eseguito allo stesso modo, poiché il denominatore della formula (il numero totale di casi) varia a seconda del tipo di probabilità .
A cosa serve una tabella di contingenza?
In quest’ultima sezione vedremo a cosa servono le tabelle di contingenza, poiché sono molto utili in statistica e probabilità.
Principalmente, una tabella di contingenza viene utilizzata per analizzare i dati per una variabile categoriale. È difficile fare uno studio statistico di questo tipo di variabili, ma utilizzando le tabelle di contingenza i dati possono essere organizzati in modo chiaro e, quindi, più facili da interpretare.
Come abbiamo visto nell’esempio precedente, è molto pratico calcolare le probabilità da una tabella di contingenza; basta avere i concetti chiari e sostituire i dati opportuni nella formula.
Inoltre, le tabelle di contingenza rendono più semplice dedurre le relazioni tra le variabili in uno studio di ricerca semplicemente osservandole, poiché presentano i dati in modo ordinato e chiaro.