So führen sie einen chi-quadrat-anpassungstest in python durch


Mithilfe eines Chi-Quadrat-Anpassungstests wird ermittelt, ob eine kategoriale Variable einer hypothetischen Verteilung folgt oder nicht.

In diesem Tutorial wird erläutert, wie Sie in Python einen Chi-Quadrat-Anpassungstest durchführen.

Beispiel: Chi-Quadrat-Anpassungstest in Python

Ein Ladenbesitzer sagt, dass an jedem Tag der Woche gleich viele Kunden in sein Geschäft kommen. Um diese Hypothese zu testen, erfasst ein Forscher die Anzahl der Kunden, die in einer bestimmten Woche in den Laden kommen, und stellt Folgendes fest:

  • Montag: 50 Kunden
  • Dienstag: 60 Kunden
  • Mittwoch: 40 Kunden
  • Donnerstag: 47 Kunden
  • Freitag: 53 Kunden

Führen Sie die folgenden Schritte aus, um in Python einen Chi-Quadrat-Anpassungstest durchzuführen und festzustellen, ob die Daten mit der Behauptung des Ladenbesitzers übereinstimmen.

Schritt 1: Erstellen Sie die Daten.

Zuerst erstellen wir zwei Tabellen, die unsere beobachtete und erwartete Anzahl an Kunden für jeden Tag enthalten:

 expected = [50, 50, 50, 50, 50]
observed = [50, 60, 40, 47, 53]

Schritt 2: Führen Sie den Chi-Quadrat-Anpassungstest durch.

Als Nächstes können wir den Chi-Quadrat-Anpassungstest mit der Chi-Quadrat-Funktion aus der SciPy-Bibliothek durchführen, die die folgende Syntax verwendet:

Chi-Quadrat (f_obs, f_exp)

Gold:

  • f_obs: ein Array beobachteter Zählungen.
  • f_exp: ein Array erwarteter Zählungen. Standardmäßig wird davon ausgegangen, dass jede Kategorie gleich wahrscheinlich ist.

Der folgende Code zeigt, wie diese Funktion in unserem konkreten Beispiel verwendet wird:

 import scipy.stats as stats

#perform Chi-Square Goodness of Fit Test
stats.chisquare(f_obs=observed, f_exp=expected)

(statistic=4.36, pvalue=0.35947)

Die Chi-Quadrat-Teststatistik beträgt 4,36 und der entsprechende p-Wert beträgt 0,35947 .

Beachten Sie, dass der p-Wert einem Chi-Quadrat-Wert mit n-1 Freiheitsgraden (DOF) entspricht, wobei n die Anzahl der verschiedenen Kategorien ist. In diesem Fall ist dof = 5-1 = 4. Sie können den Chi-Quadrat-zu-P-Wert-Rechner verwenden, um zu bestätigen, dass der p-Wert, der X 2 = 4,36 mit dof = 4 entspricht, 0,35947 beträgt.

Denken Sie daran, dass ein Chi-Quadrat-Anpassungstest die folgenden Null- und Alternativhypothesen verwendet:

  • H 0 : (Nullhypothese) Eine Variable folgt einer hypothetischen Verteilung.
  • H 1 : (Alternativhypothese) Eine Variable folgt keiner hypothetischen Verteilung.

Da der p-Wert (0,35947) nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen. Das bedeutet, dass uns nicht genügend Beweise dafür vorliegen, dass sich die tatsächliche Kundenverteilung von der vom Ladenbesitzer gemeldeten unterscheidet.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert