G-test der anpassungsgüte: definition + beispiel


In der Statistik wird der G-Test für die Anpassungsgüte verwendet, um zu bestimmen, ob eine kategoriale Variable einer hypothetischen Verteilung folgt oder nicht.

Dieser Test ist eine Alternative zum Chi-Quadrat-Anpassungstest und wird oft verwendet, wenn Ausreißer in den Daten vorhanden sind oder wenn die Daten, mit denen Sie arbeiten, extrem groß sind.

Der G-Test der Anpassungsgüte verwendet die folgenden Null- und Alternativhypothesen:

  • H 0 : Eine Variable folgt einer hypothetischen Verteilung.
  • H A : Eine Variable folgt keiner hypothetischen Verteilung.

Die Teststatistik wird wie folgt berechnet:

G=2 * Σ[O * ln(O/E)]

Gold:

  • O: Die in einer Zelle beobachtete Zahl
  • E: Die erwartete Zahl in einer Zelle

Wenn der p-Wert, der der Teststatistik entspricht, unter einem bestimmten Signifikanzniveau liegt, können Sie die Nullhypothese ablehnen und daraus schließen, dass die untersuchte Variable nicht der hypothetischen Verteilung folgt.

Das folgende Beispiel zeigt, wie ein G-Test auf Güte der Anpassung in der Praxis durchgeführt wird.

Beispiel: G-Test der Anpassungsgüte

Ein Biologe behauptet, dass in einem bestimmten Gebiet drei Schildkrötenarten zu gleichen Teilen vorkommen. Um diese Behauptung zu überprüfen, zählt ein unabhängiger Forscher die Anzahl jeder Artenart und stellt Folgendes fest:

  • Art A: 80
  • Art B: 125
  • Art C: 95

Mit den folgenden Schritten kann die unabhängige Forscherin einen G-Test auf Güte der Anpassung durchführen, um festzustellen, ob die von ihr gesammelten Daten mit den Behauptungen des Biologen übereinstimmen.

Schritt 1: Geben Sie die Null- und Alternativhypothese an.

Der Forscher führt den G-Test der Anpassungsgüte unter Verwendung der folgenden Annahmen durch:

  • H 0 : In diesem Gebiet leben zu gleichen Teilen drei Schildkrötenarten.
  • H A : In diesem Gebiet gibt es nicht den gleichen Anteil von drei Schildkrötenarten.

Schritt 2: Berechnen Sie die Teststatistik.

Die Formel zur Berechnung der Teststatistik lautet:

G=2 * Σ[O * ln(O/E)]

In diesem Beispiel werden insgesamt 300 Schildkröten beobachtet. Wenn es einen gleichen Anteil jeder Art gäbe, würden wir erwarten, 100 Schildkröten jeder Art zu beobachten. Wir können die Teststatistik also wie folgt berechnen:

G = 2 * [80*ln(80/100) + 125*ln(125/100) + 95*ln(95/100)] = 10,337

Schritt 3: Berechnen Sie den p-Wert der Teststatistik.

Laut dem Chi-Quadrat-zu-P-Wert-Rechner beträgt der mit einer Teststatistik von 10,337 und #Kategorien-1 = 3-1 = 2 Freiheitsgraden verbundene p-Wert 0,005693 .

Da dieser p-Wert kleiner als 0,05 ist, würde der Forscher die Nullhypothese ablehnen. Das bedeutet, dass sie genügend Beweise dafür hat, dass es in diesem bestimmten Gebiet nicht den gleichen Anteil jeder Schildkrötenart gibt .

Bonus: G-Test für die Anpassungsgüte in R

Sie können die Funktion Gtest() aus dem DescTools-Paket verwenden, um schnell einen G-Test auf Güte der Anpassung in R durchzuführen.

Der folgende Code zeigt, wie ein G-Test für das vorherige Beispiel durchgeführt wird:

 #load the DescTools library
library (DescTools)

#perform the G-test 
GTest(x = c(80, 125, 95), #observed values
      p = c(1/3, 1/3, 1/3), #expected proportions
      correct=" none ")

	Log likelihood ratio (G-test) goodness of fit test

data: c(80, 125, 95)
G = 10.337, X-squared df = 2, p-value = 0.005693

Beachten Sie, dass die G-Teststatistik 10,337 und der entsprechende p-Wert 0,005693 beträgt. Da dieser p-Wert kleiner als 0,05 ist, würden wir die Nullhypothese ablehnen.

Dies entspricht den Ergebnissen, die wir manuell berechnet haben.

Zusätzliche Ressourcen

Fühlen Sie sich frei, diesen G-Test-Rechner für die Anpassungsgüte zu verwenden, um automatisch einen G-Test für jeden Datensatz durchzuführen.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert