Chi-quadrat-unabhängigkeitstest in r (mit beispielen)
Ein Chi-Quadrat-Unabhängigkeitstest wird verwendet, um zu bestimmen, ob zwischen zwei kategorialen Variablen ein signifikanter Zusammenhang besteht oder nicht.
In diesem Tutorial wird erklärt, wie man einen Chi-Quadrat-Unabhängigkeitstest in R durchführt.
Beispiel: Chi-Quadrat-Test für Unabhängigkeit in R
Angenommen, wir möchten wissen, ob das Geschlecht mit der Präferenz für eine politische Partei zusammenhängt oder nicht. Wir nehmen eine einfache Zufallsstichprobe von 500 Wählern und befragen sie zu ihrer politischen Parteipräferenz. Die folgende Tabelle stellt die Ergebnisse der Umfrage dar:
Republikaner | Demokrat | Unabhängig | Gesamt | |
Männlich | 120 | 90 | 40 | 250 |
Weiblich | 110 | 95 | 45 | 250 |
Gesamt | 230 | 185 | 85 | 500 |
Führen Sie die folgenden Schritte aus, um einen Chi-Quadrat-Test der Unabhängigkeit in R durchzuführen und festzustellen, ob das Geschlecht mit der Präferenz für eine politische Partei zusammenhängt.
Schritt 1: Erstellen Sie die Daten.
Zuerst erstellen wir eine Tabelle zur Speicherung unserer Daten:
#create table data <- matrix(c(120, 90, 40, 110, 95, 45), ncol= 3 , byrow= TRUE ) colnames(data) <- c(" Rep "," Dem "," Ind ") rownames(data) <- c(" Male "," Female ") data <- as.table (data) #view table data Rep Dem Ind Male 120 90 40 Female 110 95 45
Schritt 2: Führen Sie den Chi-Quadrat-Unabhängigkeitstest durch.
Als nächstes können wir den Chi-Quadrat-Unabhängigkeitstest mit der Funktion chisq.test() durchführen:
#Perform Chi-Square Test of Independence
chisq.test(data)
Pearson's Chi-squared test
data:data
X-squared = 0.86404, df = 2, p-value = 0.6492
Das Ergebnis lässt sich wie folgt interpretieren:
- Chi-Quadrat-Teststatistik: 0,86404
- Freiheitsgrade: 2 (berechnet als #rows-1 * #columns-1)
- p-Wert: 0,6492
Denken Sie daran, dass der Chi-Quadrat-Test der Unabhängigkeit die folgenden Null- und Alternativhypothesen verwendet:
- H 0 : (Nullhypothese) Die beiden Variablen sind unabhängig.
- H 1 : (Alternativhypothese) Die beiden Variablen sind nicht unabhängig.
Da der p-Wert (0,6492) des Tests nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen. Das bedeutet, dass uns keine ausreichenden Belege dafür vorliegen, dass ein Zusammenhang zwischen Geschlecht und politischen Parteipräferenzen besteht.
Mit anderen Worten: Geschlecht und politische Parteipräferenzen sind unabhängig.
Zusätzliche Ressourcen
Eine Einführung in den Chi-Quadrat-Unabhängigkeitstest
Chi-Quadrat-Test des Unabhängigkeitsrechners
So berechnen Sie den P-Wert einer Chi-Quadrat-Statistik in R
So finden Sie den kritischen Chi-Quadrat-Wert in R