So führen sie einen chi-quadrat-unabhängigkeitstest in python durch
Ein Chi-Quadrat-Test der Unabhängigkeit wird verwendet, um zu bestimmen, ob zwischen zwei kategorialen Variablen ein signifikanter Zusammenhang besteht oder nicht.
In diesem Tutorial wird erläutert, wie Sie einen Chi-Quadrat-Unabhängigkeitstest in Python durchführen.
Beispiel: Chi-Quadrat-Unabhängigkeitstest in Python
Angenommen, wir möchten wissen, ob das Geschlecht mit der Präferenz für eine politische Partei zusammenhängt oder nicht. Wir nehmen eine einfache Zufallsstichprobe von 500 Wählern und befragen sie zu ihrer politischen Parteipräferenz. Die folgende Tabelle stellt die Ergebnisse der Umfrage dar:
Republikaner | Demokrat | Unabhängig | Gesamt | |
Männlich | 120 | 90 | 40 | 250 |
Weiblich | 110 | 95 | 45 | 250 |
Gesamt | 230 | 185 | 85 | 500 |
Führen Sie die folgenden Schritte aus, um in Python einen Chi-Quadrat-Unabhängigkeitstest durchzuführen und festzustellen, ob das Geschlecht mit der Präferenz für eine politische Partei zusammenhängt.
Schritt 1: Erstellen Sie die Daten.
Zuerst erstellen wir eine Tabelle zur Speicherung unserer Daten:
data = [[120, 90, 40], [110, 95, 45]]
Schritt 2: Führen Sie den Chi-Quadrat-Unabhängigkeitstest durch.
Als nächstes können wir den Chi-Quadrat-Unabhängigkeitstest mit der Funktion chi2_contingency aus der SciPy-Bibliothek durchführen, die die folgende Syntax verwendet:
chi2_contingency (beobachtet)
Gold:
- beobachtet: eine Kontingenztabelle der beobachteten Werte.
Der folgende Code zeigt, wie diese Funktion in unserem konkreten Beispiel verwendet wird:
import scipy.stats as stats #perform the Chi-Square Test of Independence stats.chi2_contingency(data) (0.864, 0.649, 2, array([[115. , 92.5, 42.5], [115. , 92.5, 42.5]]))
Das Ergebnis lässt sich wie folgt interpretieren:
- Chi-Quadrat-Teststatistik: 0,864
- p-Wert: 0,649
- Freiheitsgrade: 2 (berechnet als #rows-1 * #columns-1)
- Tabelle: Die letzte Tabelle zeigt die erwarteten Werte für jede Zelle in der Kontingenztabelle.
Denken Sie daran, dass derChi-Quadrat-Test der Unabhängigkeit die folgenden Null- und Alternativhypothesen verwendet:
- H 0 : (Nullhypothese) Die beiden Variablen sind unabhängig.
- H 1 : (Alternativhypothese) Die beiden Variablen sind nicht unabhängig.
Da der p-Wert (0,649) des Tests nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen. Das bedeutet, dass uns keine ausreichenden Belege dafür vorliegen, dass ein Zusammenhang zwischen Geschlecht und politischen Parteipräferenzen besteht.
Mit anderen Worten: Geschlecht und politische Parteipräferenzen sind unabhängig.