So führen sie einen chi-quadrat-anpassungstest in r durch
Mithilfe eines Chi-Quadrat-Anpassungstests wird ermittelt, ob eine kategoriale Variable einer hypothetischen Verteilung folgt oder nicht.
In diesem Tutorial wird erklärt, wie man einen Chi-Quadrat-Anpassungstest in R durchführt.
Beispiel: Chi-Quadrat-Anpassungstest in R
Ein Ladenbesitzer sagt, dass an jedem Tag der Woche gleich viele Kunden in sein Geschäft kommen. Um diese Hypothese zu testen, erfasst ein Forscher die Anzahl der Kunden, die in einer bestimmten Woche in den Laden kommen, und stellt Folgendes fest:
- Montag: 50 Kunden
- Dienstag: 60 Kunden
- Mittwoch: 40 Kunden
- Donnerstag: 47 Kunden
- Freitag: 53 Kunden
Führen Sie die folgenden Schritte aus, um einen Chi-Quadrat-Anpassungstest in R durchzuführen und festzustellen, ob die Daten mit der Behauptung des Ladenbesitzers übereinstimmen.
Schritt 1: Erstellen Sie die Daten.
Zunächst erstellen wir zwei Tabellen, die unsere beobachteten Häufigkeiten und unseren erwarteten Kundenanteil für jeden Tag enthalten:
observed <- c(50, 60, 40, 47, 53)
expected <- c(.2, .2, .2, .2, .2) #must add up to 1
Schritt 2: Führen Sie den Chi-Quadrat-Anpassungstest durch.
Als nächstes können wir den Chi-Quadrat-Anpassungstest mit der Funktion chisq.test() durchführen, die die folgende Syntax verwendet:
chisq.test(x, p)
Gold:
- x: Ein numerischer Vektor der beobachteten Frequenzen.
- p: Ein numerischer Vektor mit erwarteten Proportionen.
Der folgende Code zeigt, wie diese Funktion in unserem Beispiel verwendet wird:
#perform Chi-Square Goodness of Fit Test
chisq.test(x=observed, p=expected)
Chi-squared test for given probabilities
data: observed
X-squared = 4.36, df = 4, p-value = 0.3595
Die Chi-Quadrat-Teststatistik beträgt 4,36 und der entsprechende p-Wert beträgt 0,3595 .
Beachten Sie, dass der p-Wert einem Chi-Quadrat-Wert mit n-1 Freiheitsgraden (DOF) entspricht, wobei n die Anzahl der verschiedenen Kategorien ist. In diesem Fall ist df = 5-1 = 4.
Sie können den Chi-Quadrat-zu-P-Wert-Rechner verwenden, um zu bestätigen, dass der p-Wert, der X 2 = 4,36 mit df = 4 entspricht, 0,35947 beträgt.
Denken Sie daran, dass ein Chi-Quadrat-Anpassungstest die folgenden Null- und Alternativhypothesen verwendet:
- H 0 : (Nullhypothese) Eine Variable folgt einer hypothetischen Verteilung.
- H 1 : (Alternativhypothese) Eine Variable folgt keiner hypothetischen Verteilung.
Da der p-Wert (0,35947) nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen. Das bedeutet, dass uns nicht genügend Beweise dafür vorliegen, dass sich die tatsächliche Kundenverteilung von der vom Ladenbesitzer gemeldeten unterscheidet.
Zusätzliche Ressourcen
So führen Sie einen Chi-Quadrat-Unabhängigkeitstest in R durch
So berechnen Sie den P-Wert einer Chi-Quadrat-Statistik in R
So finden Sie den kritischen Chi-Quadrat-Wert in R