G-test der anpassungsgüte: definition + beispiel
In der Statistik wird der G-Test für die Anpassungsgüte verwendet, um zu bestimmen, ob eine kategoriale Variable einer hypothetischen Verteilung folgt oder nicht.
Dieser Test ist eine Alternative zum Chi-Quadrat-Anpassungstest und wird oft verwendet, wenn Ausreißer in den Daten vorhanden sind oder wenn die Daten, mit denen Sie arbeiten, extrem groß sind.
Der G-Test der Anpassungsgüte verwendet die folgenden Null- und Alternativhypothesen:
- H 0 : Eine Variable folgt einer hypothetischen Verteilung.
- H A : Eine Variable folgt keiner hypothetischen Verteilung.
Die Teststatistik wird wie folgt berechnet:
G=2 * Σ[O * ln(O/E)]
Gold:
- O: Die in einer Zelle beobachtete Zahl
- E: Die erwartete Zahl in einer Zelle
Wenn der p-Wert, der der Teststatistik entspricht, unter einem bestimmten Signifikanzniveau liegt, können Sie die Nullhypothese ablehnen und daraus schließen, dass die untersuchte Variable nicht der hypothetischen Verteilung folgt.
Das folgende Beispiel zeigt, wie ein G-Test auf Güte der Anpassung in der Praxis durchgeführt wird.
Beispiel: G-Test der Anpassungsgüte
Ein Biologe behauptet, dass in einem bestimmten Gebiet drei Schildkrötenarten zu gleichen Teilen vorkommen. Um diese Behauptung zu überprüfen, zählt ein unabhängiger Forscher die Anzahl jeder Artenart und stellt Folgendes fest:
- Art A: 80
- Art B: 125
- Art C: 95
Mit den folgenden Schritten kann die unabhängige Forscherin einen G-Test auf Güte der Anpassung durchführen, um festzustellen, ob die von ihr gesammelten Daten mit den Behauptungen des Biologen übereinstimmen.
Schritt 1: Geben Sie die Null- und Alternativhypothese an.
Der Forscher führt den G-Test der Anpassungsgüte unter Verwendung der folgenden Annahmen durch:
- H 0 : In diesem Gebiet leben zu gleichen Teilen drei Schildkrötenarten.
- H A : In diesem Gebiet gibt es nicht den gleichen Anteil von drei Schildkrötenarten.
Schritt 2: Berechnen Sie die Teststatistik.
Die Formel zur Berechnung der Teststatistik lautet:
G=2 * Σ[O * ln(O/E)]
In diesem Beispiel werden insgesamt 300 Schildkröten beobachtet. Wenn es einen gleichen Anteil jeder Art gäbe, würden wir erwarten, 100 Schildkröten jeder Art zu beobachten. Wir können die Teststatistik also wie folgt berechnen:
G = 2 * [80*ln(80/100) + 125*ln(125/100) + 95*ln(95/100)] = 10,337
Schritt 3: Berechnen Sie den p-Wert der Teststatistik.
Laut dem Chi-Quadrat-zu-P-Wert-Rechner beträgt der mit einer Teststatistik von 10,337 und #Kategorien-1 = 3-1 = 2 Freiheitsgraden verbundene p-Wert 0,005693 .
Da dieser p-Wert kleiner als 0,05 ist, würde der Forscher die Nullhypothese ablehnen. Das bedeutet, dass sie genügend Beweise dafür hat, dass es in diesem bestimmten Gebiet nicht den gleichen Anteil jeder Schildkrötenart gibt .
Bonus: G-Test für die Anpassungsgüte in R
Sie können die Funktion Gtest() aus dem DescTools-Paket verwenden, um schnell einen G-Test auf Güte der Anpassung in R durchzuführen.
Der folgende Code zeigt, wie ein G-Test für das vorherige Beispiel durchgeführt wird:
#load the DescTools library library (DescTools) #perform the G-test GTest(x = c(80, 125, 95), #observed values p = c(1/3, 1/3, 1/3), #expected proportions correct=" none ") Log likelihood ratio (G-test) goodness of fit test data: c(80, 125, 95) G = 10.337, X-squared df = 2, p-value = 0.005693
Beachten Sie, dass die G-Teststatistik 10,337 und der entsprechende p-Wert 0,005693 beträgt. Da dieser p-Wert kleiner als 0,05 ist, würden wir die Nullhypothese ablehnen.
Dies entspricht den Ergebnissen, die wir manuell berechnet haben.
Zusätzliche Ressourcen
Fühlen Sie sich frei, diesen G-Test-Rechner für die Anpassungsgüte zu verwenden, um automatisch einen G-Test für jeden Datensatz durchzuführen.