So führen sie einen chi-quadrat-test der unabhängigkeit in stata durch
Ein Chi-Quadrat-Unabhängigkeitstest wird verwendet, um zu bestimmen, ob zwischen zwei kategorialen Variablen ein signifikanter Zusammenhang besteht oder nicht.
In diesem Tutorial wird erläutert, wie Sie in Stata einen Chi-Quadrat-Unabhängigkeitstest durchführen.
Beispiel: Chi-Quadrat-Test der Unabhängigkeit in Stata
Für dieses Beispiel verwenden wir einen Datensatz namens auto , der Informationen zu 74 verschiedenen Automobilen aus dem Jahr 1978 enthält.
Befolgen Sie die folgenden Schritte, um einen Chi-Quadrat-Unabhängigkeitstest durchzuführen und festzustellen, ob ein signifikanter Zusammenhang zwischen den folgenden beiden Variablen besteht:
- rep78: Die Häufigkeit, mit der das Auto im Jahr 1978 repariert wurde (variiert zwischen 1 und 5)
- Ausländisch: ob der Fahrzeugtyp fremd ist oder nicht (0 = nein, 1 = ja)
Schritt 1: Rohdaten laden und anzeigen.
Zuerst laden wir die Daten, indem wir den folgenden Befehl eingeben:
automatische Nutzung des Systems
Wir können die Rohdaten anzeigen, indem wir den folgenden Befehl eingeben:
br
In jeder Zeile werden Informationen zu einem einzelnen Auto angezeigt, darunter Preis, mpg, Gewicht, Länge und verschiedene andere Variablen. Die einzigen zwei Variablen, die uns interessieren, sind rep78 und Foreign .
Schritt 3: Führen Sie den Chi-Quadrat-Test der Unabhängigkeit durch.
Wir werden die folgende Syntax verwenden, um den Test durchzuführen:
Tab erste_Variable zweite_Variable, chi2
Hier ist die genaue Syntax, die wir in unserem Fall verwenden werden:
ausländischer Vertreter78 Tab, Chi2
So interpretieren Sie das Ergebnis:
Übersichtstabelle: Diese Tabelle zeigt die Gesamtzahl jeder Kombination aus rep78 und Foreign . Zum Beispiel
- Im Jahr 1978 gab es zwei inländische Autos und eine Reparatur.
- Es gab 8 inländische Autos und erhielt 1978 2 Reparaturen.
- Es gab 27 inländische Autos, die 1978 drei Reparaturen erhielten.
Und so weiter.
Pearson chisq(4): Dies ist die Chi-Quadrat-Teststatistik für den Test. Es stellt sich heraus, dass es 27,2640 ist.
Pr: Dies ist der p-Wert, der der Chi-Quadrat-Teststatistik zugeordnet ist. Es stellt sich heraus, dass es 0,000 ist. Da dieser Wert kleiner als 0,05 ist, können wir die Nullhypothese, dass die beiden Variablen unabhängig sind, nicht ablehnen. Wir haben genügend Beweise, um zu dem Schluss zu kommen, dass ein statistisch signifikanter Zusammenhang zwischen der Frage, ob ein Auto ausländisch ist oder nicht, und der Gesamtzahl der Reparaturen besteht, die es durchlaufen hat.