Test di indipendenza del chi-quadrato: definizione, formula ed esempio
Un test di indipendenza chi quadrato viene utilizzato per determinare se esiste o meno un’associazione significativa tra due variabili categoriali.
Questo tutorial spiega quanto segue:
- La motivazione per eseguire un test di indipendenza chi-quadrato.
- La formula per eseguire un test di indipendenza chi quadrato.
- Un esempio di come eseguire un test di indipendenza chi quadrato.
Test di indipendenza del chi quadrato: motivazione
Un test di indipendenza del chi quadrato può essere utilizzato per determinare se esiste un’associazione tra due variabili categoriali in molti contesti diversi. Ecco alcuni esempi:
- Vogliamo sapere se il genere è associato alla preferenza per un partito politico. Quindi abbiamo intervistato 500 elettori e registrato le loro preferenze di genere e di partito politico.
- Vogliamo sapere se il colore preferito di una persona è associato al suo sport preferito. Quindi abbiamo intervistato 100 persone e abbiamo chiesto loro quali sono le loro preferenze per entrambi.
- Vogliamo sapere se il livello di istruzione e lo stato civile sono associati. Raccogliamo quindi dati su queste due variabili su un campione casuale semplice di 50 persone.
In ciascuno di questi scenari, vogliamo sapere se due variabili categoriali sono associate tra loro. In ogni scenario, possiamo utilizzare un test di indipendenza del Chi-quadrato per determinare se esiste un’associazione statisticamente significativa tra le variabili.
Test di indipendenza del chi quadrato: formula
Un test di indipendenza chi quadrato utilizza le seguenti ipotesi nulle e alternative:
- H 0 : (ipotesi nulla) Le due variabili sono indipendenti.
- H 1 : (ipotesi alternativa) Le due variabili non sono indipendenti. (cioè sono associati)
Usiamo la seguente formula per calcolare la statistica del test Chi-quadrato x 2 :
X2 = Σ(OE) 2 / E
Oro:
- Σ: è un simbolo di fantasia che significa “somma”
- O: valore osservato
- E: valore atteso
Se il valore p che corrisponde alla statistica test X 2 con (#righe-1)*(#colonne-1) gradi di libertà è inferiore al livello di significatività scelto, è possibile rifiutare l’ipotesi nulla.
Test di indipendenza del chi-quadrato: esempio
Supponiamo di voler sapere se il genere è associato o meno alla preferenza per un partito politico. Prendiamo un semplice campione casuale di 500 elettori e chiediamo loro quale sia la loro preferenza per il partito politico. La tabella seguente presenta i risultati dell’indagine:
Repubblicano | Democratico | Indipendente | Totale | |
Maschio | 120 | 90 | 40 | 250 |
Femmina | 110 | 95 | 45 | 250 |
Totale | 230 | 185 | 85 | 500 |
Utilizzare i seguenti passaggi per eseguire un test di indipendenza chi-quadrato per determinare se il genere è associato alla preferenza del partito politico.
Passaggio 1: definire le ipotesi.
Effettueremo il test di indipendenza del Chi-quadrato utilizzando le seguenti ipotesi:
- H 0 : Le preferenze di genere e di partito politico sono indipendenti.
- H 1 : Le preferenze di genere e di partito politico non sono indipendenti.
Passaggio 2: calcolare i valori attesi.
Successivamente, calcoleremo i valori attesi per ciascuna cella nella tabella di contingenza utilizzando la seguente formula:
Valore previsto = (somma delle righe * somma delle colonne) / somma della tabella.
Ad esempio, il valore atteso per gli uomini repubblicani è: (230*250) / 500 = 115 .
Possiamo ripetere questa formula per ottenere il valore atteso per ciascuna cella della tabella:
Repubblicano | Democratico | Indipendente | Totale | |
Maschio | 115 | 92,5 | 42,5 | 250 |
Femmina | 115 | 92,5 | 42,5 | 250 |
Totale | 230 | 185 | 85 | 500 |
Passaggio 3: Calcola (OE) 2 /E per ogni cella della tabella.
Successivamente, calcoleremo (OE) 2 /E per ciascuna cella della tabella dove:
- O: valore osservato
- E: valore atteso
Ad esempio, i repubblicani uomini avrebbero un valore di: (120-115) 2 /115 = 0,2174 .
Possiamo ripetere questa formula per ogni cella della tabella:
Repubblicano | Democratico | Indipendente | |
Maschio | 0,2174 | 0,0676 | 0,1471 |
Femmina | 0,2174 | 0,0676 | 0,1471 |
Passaggio 4: calcolare la statistica del test X2 e il corrispondente valore p.
X2 = σ(OE) 2 / E = 0,2174 + 0,2174 + 0,0676 + 0,0676 + 0,1471 + 0,1471 = 0,8642
Secondo il calcolatore del punteggio chi quadrato per il valore P , il valore p associato a X 2 = 0,8642 e (2-1)*(3-1) = 2 gradi di libertà è 0,649198 .
Passaggio 5: trarre una conclusione.
Poiché questo valore p non è inferiore a 0,05, non riusciamo a rifiutare l’ipotesi nulla. Ciò significa che non abbiamo prove sufficienti per affermare che esista un’associazione tra le preferenze di genere e quelle dei partiti politici.
Nota: puoi anche eseguire l’intero test semplicemente utilizzando il calcolatore del test di indipendenza del chi quadrato .
Risorse addizionali
I seguenti tutorial spiegano come eseguire un test di indipendenza chi-quadrato utilizzando diversi programmi statistici:
Come eseguire un test di indipendenza chi quadrato in Stata
Come eseguire un test di indipendenza del chi quadrato in Excel
Come eseguire un test di indipendenza del chi quadrato in SPSS
Come eseguire un test di indipendenza del chi quadrato in Python
Come eseguire un test di indipendenza del chi quadrato in R
Test di indipendenza del chi quadrato su una calcolatrice TI-84
Calcolatore del test di indipendenza chi quadrato