Chi-quadrat-unabhängigkeitstest: definition, formel und beispiel
Ein Chi-Quadrat-Unabhängigkeitstest wird verwendet, um zu bestimmen, ob zwischen zwei kategorialen Variablen ein signifikanter Zusammenhang besteht oder nicht.
In diesem Tutorial wird Folgendes erklärt:
- Die Motivation, einen Chi-Quadrat-Test zur Unabhängigkeit durchzuführen.
- Die Formel zur Durchführung eines Chi-Quadrat-Unabhängigkeitstests.
- Ein Beispiel für die Durchführung eines Chi-Quadrat-Tests zur Unabhängigkeit.
Chi-Quadrat-Unabhängigkeitstest: Motivation
Ein Chi-Quadrat-Unabhängigkeitstest kann verwendet werden, um festzustellen, ob in vielen verschiedenen Kontexten ein Zusammenhang zwischen zwei kategorialen Variablen besteht. Hier sind einige Beispiele:
- Wir möchten wissen, ob das Geschlecht mit der Präferenz für eine politische Partei zusammenhängt. Deshalb befragen wir 500 Wähler und erfassen deren Geschlecht und Parteipräferenz.
- Wir möchten wissen, ob die Lieblingsfarbe einer Person mit ihrem Lieblingssport verbunden ist. Deshalb befragen wir 100 Menschen und fragen sie, welche Vorlieben sie für beides haben.
- Wir möchten wissen, ob Bildungsniveau und Familienstand zusammenhängen. Wir erheben daher Daten zu diesen beiden Variablen anhand einer einfachen Zufallsstichprobe von 50 Personen.
In jedem dieser Szenarios möchten wir wissen, ob zwei kategoriale Variablen miteinander verknüpft sind. In jedem Szenario können wir einen Chi-Quadrat-Unabhängigkeitstest verwenden, um festzustellen, ob zwischen den Variablen ein statistisch signifikanter Zusammenhang besteht.
Chi-Quadrat-Unabhängigkeitstest: Formel
Ein Chi-Quadrat-Unabhängigkeitstest verwendet die folgenden Null- und Alternativhypothesen:
- H 0 : (Nullhypothese) Die beiden Variablen sind unabhängig.
- H 1 : (Alternativhypothese) Die beiden Variablen sind nicht unabhängig. (d. h. sie sind verbunden)
Wir verwenden die folgende Formel, um die Chi-Quadrat-x- 2- Teststatistik zu berechnen:
X 2 = Σ(OE) 2 / E
Gold:
- Σ: ist ein ausgefallenes Symbol, das „Summe“ bedeutet
- O: beobachteter Wert
- E: erwarteter Wert
Wenn der p-Wert, der der Teststatistik X 2 mit (#Zeilen-1)*(#Spalten-1) Freiheitsgraden entspricht, kleiner als das gewählte Signifikanzniveau ist, können Sie die Nullhypothese ablehnen.
Chi-Quadrat-Unabhängigkeitstest: Beispiel
Angenommen, wir möchten wissen, ob das Geschlecht mit der Präferenz für eine politische Partei zusammenhängt oder nicht. Wir nehmen eine einfache Zufallsstichprobe von 500 Wählern und befragen sie zu ihrer politischen Parteipräferenz. Die folgende Tabelle stellt die Ergebnisse der Umfrage dar:
Republikaner | Demokrat | Unabhängig | Gesamt | |
Männlich | 120 | 90 | 40 | 250 |
Weiblich | 110 | 95 | 45 | 250 |
Gesamt | 230 | 185 | 85 | 500 |
Führen Sie mit den folgenden Schritten einen Chi-Quadrat-Test zur Unabhängigkeit durch, um festzustellen, ob das Geschlecht mit der Präferenz für eine politische Partei zusammenhängt.
Schritt 1: Annahmen definieren.
Wir werden den Chi-Quadrat-Test der Unabhängigkeit unter Verwendung der folgenden Annahmen durchführen:
- H 0 : Geschlecht und politische Parteipräferenzen sind unabhängig.
- H 1 : Geschlecht und politische Parteipräferenzen sind nicht unabhängig.
Schritt 2: Erwartete Werte berechnen.
Als nächstes berechnen wir die erwarteten Werte für jede Zelle in der Kontingenztabelle mithilfe der folgenden Formel:
Erwarteter Wert = (Summe der Zeilen * Summe der Spalten) / Summe der Tabelle.
Der erwartete Wert für republikanische Männer beträgt beispielsweise: (230*250) / 500 = 115 .
Wir können diese Formel wiederholen, um den erwarteten Wert für jede Tabellenzelle zu erhalten:
Republikaner | Demokrat | Unabhängig | Gesamt | |
Männlich | 115 | 92,5 | 42,5 | 250 |
Weiblich | 115 | 92,5 | 42,5 | 250 |
Gesamt | 230 | 185 | 85 | 500 |
Schritt 3: Berechnen Sie (OE) 2 /E für jede Zelle in der Tabelle.
Als nächstes berechnen wir (OE) 2 /E für jede Zelle in der Tabelle, wobei:
- O: beobachteter Wert
- E: erwarteter Wert
Männliche Republikaner hätten beispielsweise einen Wert von: (120-115) 2 /115 = 0,2174 .
Wir können diese Formel für jede Zelle in der Tabelle wiederholen:
Republikaner | Demokrat | Unabhängig | |
Männlich | 0,2174 | 0,0676 | 0,1471 |
Weiblich | 0,2174 | 0,0676 | 0,1471 |
Schritt 4: Berechnen Sie die Teststatistik X2 und den entsprechenden p-Wert.
X 2 = σ (OE) 2 / E = 0,2174 + 0,2174 + 0,0676 + 0,0676 + 0,1471 + 0,1471 = 0,8642
Laut dem Chi-Quadrat-Score-Rechner für den P-Wert beträgt der mit X 2 = 0,8642 und (2-1)*(3-1) = 2 Freiheitsgraden verbundene p-Wert 0,649198 .
Schritt 5: Ziehen Sie eine Schlussfolgerung.
Da dieser p-Wert nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen. Das bedeutet, dass uns keine ausreichenden Belege dafür vorliegen, dass ein Zusammenhang zwischen Geschlecht und politischen Parteipräferenzen besteht.
Hinweis: Sie können den gesamten Test auch durchführen, indem Sie einfach den Chi-Quadrat-Unabhängigkeitstest-Rechner verwenden.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie mit verschiedenen Statistikprogrammen einen Chi-Quadrat-Unabhängigkeitstest durchführen:
So führen Sie einen Chi-Quadrat-Unabhängigkeitstest in Stata durch
So führen Sie einen Chi-Quadrat-Unabhängigkeitstest in Excel durch
So führen Sie einen Chi-Quadrat-Unabhängigkeitstest in SPSS durch
So führen Sie einen Chi-Quadrat-Unabhängigkeitstest in Python durch
So führen Sie einen Chi-Quadrat-Unabhängigkeitstest in R durch
Chi-Quadrat-Unabhängigkeitstest auf einem TI-84-Rechner
Chi-Quadrat-Test des Unabhängigkeitsrechners