Chi-quadrat-test
In diesem Artikel wird erklärt, was der Chi-Quadrat-Test in der Statistik ist und wofür er verwendet wird. Außerdem erfahren Sie, wie Sie einen Chi-Quadrat-Test durchführen und zusätzlich eine Schritt-für-Schritt-Übung.
Was ist der Chi-Quadrat-Test?
Der Chi-Quadrat-Test ist ein statistischer Test, mit dem festgestellt wird, ob ein statistisch signifikanter Unterschied zwischen der erwarteten Häufigkeit und der beobachteten Häufigkeit besteht.
Logischerweise folgt die Chi-Quadrat-Teststatistik einer Chi-Quadrat-Verteilung . Der Wert der Teststatistik muss daher mit einem bestimmten Wert der Chi-Quadrat-Verteilung verglichen werden. Nachfolgend sehen wir, wie der Chi-Quadrat-Test durchgeführt wird.
Diese Art von statistischem Test wird auch als Pearson-Chi-Quadrat-Test bezeichnet und manchmal durch das Symbol für die Chi-Quadrat-Verteilung dargestellt: χ²-Test .
Chi-Quadrat-Testformel
Die Chi-Quadrat-Teststatistik entspricht der Summe der Quadrate der Differenzen zwischen den beobachteten Werten und den erwarteten Werten geteilt durch die erwarteten Werte.
Die Formel für den Chi-Quadrat-Test lautet also:
Gold:
-
ist die Chi-Quadrat-Teststatistik, die einer Chi-Quadrat-Verteilung folgt
Freiheitsgrade.
-
ist die Datenstichprobengröße.
-
ist der beobachtete Wert für Daten i.
-
ist der erwartete Wert für Daten i.
Die Nullhypothese beim Hypothesentest eines Chi-Quadrat-Tests besagt, dass die beobachteten Werte den erwarteten Werten entsprechen. Andererseits besteht die Alternativhypothese des Tests darin, dass einer der beobachteten Werte von seinem erwarteten Wert abweicht.
Also ein Signifikanzniveau vorausgesetzt
, sollte die berechnete Teststatistik mit dem kritischen Testwert verglichen werden, um zu bestimmen, ob die Nullhypothese oder die Alternativhypothese abzulehnen ist:
- Wenn die Teststatistik unter dem kritischen Wert liegt
, wird die Alternativhypothese abgelehnt (und die Nullhypothese akzeptiert).
- Wenn die Teststatistik größer als der kritische Wert ist
, wird die Nullhypothese abgelehnt (und die Alternativhypothese akzeptiert).
Beispiel für den Chi-Quadrat-Test
Nachdem wir die Definition des Chi-Quadrat-Tests und seine Formel gesehen haben, wird unten ein Schritt-für-Schritt-Lösungsbeispiel präsentiert, damit Sie sehen können, wie diese Art von statistischem Test durchgeführt wird.
- Ein Ladenbesitzer gibt an, dass 50 % seines Umsatzes auf Produkt A entfallen, 35 % seines Umsatzes auf Produkt B und 15 % seines Umsatzes auf Produkt C. Die verkauften Einheiten jedes Produkts entsprechen jedoch denen, die sie präsentieren in der folgenden Kontingenztabelle . Analysieren Sie, ob sich die theoretischen Daten des Eigentümers statistisch von den tatsächlich erfassten Daten unterscheiden.
Produkt | Beobachtete Verkäufe (O i ) |
---|---|
Produkt A | 453 |
Produkt B | 268 |
Produkt C | 79 |
Gesamt | 800 |
Zunächst müssen wir die vom Ladenbesitzer erwarteten Werte berechnen. Dazu multiplizieren wir den Prozentsatz der erwarteten Verkäufe jedes Produkts mit der Anzahl der erzielten Gesamtverkäufe:
Daher lautet die Häufigkeitsverteilungstabelle des Problems wie folgt:
Produkt | Beobachtete Verkäufe (O i ) | Erwarteter Umsatz (E i ) |
---|---|---|
Produkt A | 453 | 400 |
Produkt B | 268 | 280 |
Produkt C | 79 | 120 |
Gesamt | 800 | 800 |
Nachdem wir nun alle Werte berechnet haben, wenden wir die Chi-Quadrat-Testformel an, um die Teststatistik zu berechnen:
Sobald der Wert der Teststatistik berechnet ist, verwenden wir die Chi-Quadrat-Verteilungstabelle, um den kritischen Wert des Tests zu ermitteln. Die Chi-Quadrat-Verteilung hat
Freiheitsgrade, also wenn wir ein Signifikanzniveau wählen
Der kritische Wert des Tests ist wie folgt:
Somit ist die Teststatistik (21,53) größer als der kritische Testwert (5,991), daher wird die Nullhypothese abgelehnt und die Alternativhypothese akzeptiert. Dies bedeutet, dass die Daten sehr unterschiedlich sind und der Ladenbesitzer daher andere Umsätze erwartet als tatsächlich getätigt hat.
Interpretation des Chi-Quadrat-Tests
Die Interpretation des Chi-Quadrat-Tests kann nicht allein anhand des erhaltenen Testergebnisses erfolgen, sondern muss mit dem kritischen Wert des Tests verglichen werden.
Logischerweise gilt: Je kleiner der Wert der berechneten Teststatistik, desto ähnlicher sind die beobachteten Daten den erwarteten Daten. Wenn das Ergebnis des Chi-Quadrat-Tests also 0 ist, bedeutet dies, dass die beobachteten Werte und die erwarteten Werte genau gleich sind. Je größer das Testergebnis ist, desto stärker weichen die beobachteten Werte von den erwarteten Werten ab.
Um jedoch zu entscheiden, ob die beiden Datensätze statistisch unterschiedlich oder gleich sind, muss man den berechneten Testwert mit dem kritischen Testwert vergleichen, um die Nullhypothese oder die Alternativhypothese des Kontrasts zu verwerfen. Wenn die Teststatistik kleiner als der kritische Wert der Verteilung ist, wird die Alternativhypothese abgelehnt. Wenn andererseits die Teststatistik größer als der kritische Wert der Verteilung ist, wird die Nullhypothese abgelehnt.