Test di indipendenza del chi quadrato in r (con esempi)


Un test di indipendenza chi quadrato viene utilizzato per determinare se esiste o meno un’associazione significativa tra due variabili categoriali .

Questo tutorial spiega come eseguire un test di indipendenza chi-quadrato in R.

Esempio: test chi quadrato per l’indipendenza in R

Supponiamo di voler sapere se il genere è associato o meno alla preferenza per un partito politico. Prendiamo un semplice campione casuale di 500 elettori e chiediamo loro quale sia la loro preferenza per il partito politico. La tabella seguente presenta i risultati dell’indagine:

Repubblicano Democratico Indipendente Totale
Maschio 120 90 40 250
Femmina 110 95 45 250
Totale 230 185 85 500

Utilizzare i passaggi seguenti per eseguire un test di indipendenza chi quadrato in R per determinare se il genere è associato alla preferenza del partito politico.

Passaggio 1: creare i dati.

Per prima cosa creeremo una tabella per contenere i nostri dati:

 #create table
data <- matrix(c(120, 90, 40, 110, 95, 45), ncol= 3 , byrow= TRUE )
colnames(data) <- c(" Rep "," Dem "," Ind ")
rownames(data) <- c(" Male "," Female ")
data <- as.table (data)

#view table
data

       Rep Dem Ind
Male 120 90 40
Female 110 95 45

Passaggio 2: eseguire il test di indipendenza del chi quadrato.

Successivamente, possiamo eseguire il test di indipendenza del chi-quadrato utilizzando la funzione chisq.test() :

 #Perform Chi-Square Test of Independence
chisq.test(data)

	Pearson's Chi-squared test

data:data
X-squared = 0.86404, df = 2, p-value = 0.6492

Il modo di interpretare il risultato è il seguente:

  • Statistica del test chi quadrato: 0,86404
  • Gradi di libertà: 2 (calcolati come #righe-1 * #colonne-1)
  • valore p: 0,6492

Ricordiamo che il test di indipendenza del chi quadrato utilizza le seguenti ipotesi nulle e alternative:

  • H 0 : (ipotesi nulla) Le due variabili sono indipendenti.
  • H 1 : (ipotesi alternativa) Le due variabili non sono indipendenti.

Poiché il valore p (0,6492) del test non è inferiore a 0,05, non riusciamo a rifiutare l’ipotesi nulla. Ciò significa che non abbiamo prove sufficienti per affermare che esista un’associazione tra le preferenze di genere e quelle dei partiti politici.

In altre parole, le preferenze di genere e di partito politico sono indipendenti.

Risorse addizionali

Un’introduzione al test di indipendenza del chi quadrato
Calcolatore del test di indipendenza chi quadrato
Come calcolare il valore P di una statistica chi-quadrato in R
Come trovare il valore critico del chi quadrato in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *