Test di indipendenza del chi quadrato in r (con esempi)
Un test di indipendenza chi quadrato viene utilizzato per determinare se esiste o meno un’associazione significativa tra due variabili categoriali .
Questo tutorial spiega come eseguire un test di indipendenza chi-quadrato in R.
Esempio: test chi quadrato per l’indipendenza in R
Supponiamo di voler sapere se il genere è associato o meno alla preferenza per un partito politico. Prendiamo un semplice campione casuale di 500 elettori e chiediamo loro quale sia la loro preferenza per il partito politico. La tabella seguente presenta i risultati dell’indagine:
Repubblicano | Democratico | Indipendente | Totale | |
Maschio | 120 | 90 | 40 | 250 |
Femmina | 110 | 95 | 45 | 250 |
Totale | 230 | 185 | 85 | 500 |
Utilizzare i passaggi seguenti per eseguire un test di indipendenza chi quadrato in R per determinare se il genere è associato alla preferenza del partito politico.
Passaggio 1: creare i dati.
Per prima cosa creeremo una tabella per contenere i nostri dati:
#create table data <- matrix(c(120, 90, 40, 110, 95, 45), ncol= 3 , byrow= TRUE ) colnames(data) <- c(" Rep "," Dem "," Ind ") rownames(data) <- c(" Male "," Female ") data <- as.table (data) #view table data Rep Dem Ind Male 120 90 40 Female 110 95 45
Passaggio 2: eseguire il test di indipendenza del chi quadrato.
Successivamente, possiamo eseguire il test di indipendenza del chi-quadrato utilizzando la funzione chisq.test() :
#Perform Chi-Square Test of Independence
chisq.test(data)
Pearson's Chi-squared test
data:data
X-squared = 0.86404, df = 2, p-value = 0.6492
Il modo di interpretare il risultato è il seguente:
- Statistica del test chi quadrato: 0,86404
- Gradi di libertà: 2 (calcolati come #righe-1 * #colonne-1)
- valore p: 0,6492
Ricordiamo che il test di indipendenza del chi quadrato utilizza le seguenti ipotesi nulle e alternative:
- H 0 : (ipotesi nulla) Le due variabili sono indipendenti.
- H 1 : (ipotesi alternativa) Le due variabili non sono indipendenti.
Poiché il valore p (0,6492) del test non è inferiore a 0,05, non riusciamo a rifiutare l’ipotesi nulla. Ciò significa che non abbiamo prove sufficienti per affermare che esista un’associazione tra le preferenze di genere e quelle dei partiti politici.
In altre parole, le preferenze di genere e di partito politico sono indipendenti.
Risorse addizionali
Un’introduzione al test di indipendenza del chi quadrato
Calcolatore del test di indipendenza chi quadrato
Come calcolare il valore P di una statistica chi-quadrato in R
Come trovare il valore critico del chi quadrato in R