Eignungstest
In diesem Artikel wird erläutert, was ein Anpassungstest ist und wofür er in der Statistik verwendet wird. Außerdem wird gezeigt, wie man einen Fit-Test durchführt, und außerdem können Sie sehen, wie eine Übung Schritt für Schritt gelöst wird.
Was ist ein Fit-Test?
Der Anpassungstest ist ein statistischer Test, mit dem wir feststellen können, ob eine Datenstichprobe zu einer bestimmten Wahrscheinlichkeitsverteilung passt oder nicht. Mit anderen Worten wird mit dem Angemessenheitstest überprüft, ob die beobachteten Daten den erwarteten Daten entsprechen.
Häufig versuchen wir, Vorhersagen über ein Phänomen zu treffen und haben als Ergebnis erwartete Werte über dieses Phänomen, von denen wir glauben, dass sie eintreten werden. Allerdings müssen wir dann die Daten erheben und prüfen, ob die erhobenen Daten unseren Erwartungen entsprechen. Angemessenheitstests ermöglichen es uns also, anhand eines statistischen Kriteriums zu entscheiden, ob die erwarteten Daten und die beobachteten Daten ähnlich sind oder nicht.
Somit ist der Anpassungstest ein Hypothesentest , dessen Nullhypothese besagt, dass die beobachteten Werte gleich den erwarteten Werten sind, wohingegen die Alternativhypothese des Tests darauf hinweist, dass die beobachteten Werte statistisch unterschiedlich sind von den erwarteten Werten ab.
In der Statistik wird der Anpassungstest auch als Chi-Quadrat-Test bezeichnet, da die Referenzverteilung des Tests die Chi-Quadrat-Verteilung ist.
Fit-Test-Formel
Die Anpassungsteststatistik entspricht der Summe der Quadrate der Differenzen zwischen den beobachteten Werten und den erwarteten Werten geteilt durch die erwarteten Werte.
Die Formel für den Angemessenheitstest lautet also wie folgt:
Gold:
-
ist die Anpassungsteststatistik, die einer Chi-Quadrat-Verteilung folgt
Freiheitsgrade.
-
ist die Datenstichprobengröße.
-
ist der beobachtete Wert für Daten i.
-
ist der erwartete Wert für Daten i.
Somit ist ein Signifikanzniveau gegeben
, sollte die berechnete Teststatistik mit dem kritischen Testwert verglichen werden, um zu bestimmen, ob die Nullhypothese oder die Alternativhypothese des Hypothesentests abzulehnen ist:
- Wenn die Teststatistik unter dem kritischen Wert liegt
, wird die Alternativhypothese abgelehnt (und die Nullhypothese akzeptiert).
- Wenn die Teststatistik größer als der kritische Wert ist
, wird die Nullhypothese abgelehnt (und die Alternativhypothese akzeptiert).
So führen Sie einen Fit-Test durch
Um einen Eignungstest durchzuführen, sollten die folgenden Schritte befolgt werden:
- Wir stellen zunächst die Nullhypothese und die Alternativhypothese des Anpassungstests auf.
- Zweitens wählen wir das Konfidenzniveau und damit das Signifikanzniveau des Anpassungstests.
- Als nächstes berechnen wir die Anpassungsteststatistik, deren Formel im obigen Abschnitt zu finden ist.
- Wir ermitteln den kritischen Wert des Anpassungstests mithilfe der Chi-Quadrat-Verteilungstabelle.
- Wir vergleichen die Teststatistik mit dem kritischen Wert:
- Wenn die Teststatistik kleiner als der kritische Wert ist, wird die Alternativhypothese abgelehnt (und die Nullhypothese akzeptiert).
- Wenn die Teststatistik größer als der kritische Wert ist, wird die Nullhypothese abgelehnt (und die Alternativhypothese akzeptiert).
Beispiel für einen Angemessenheitstest
- Eine Ladenbesitzerin gibt an, dass 50 % ihres Umsatzes auf Produkt A, 35 % ihres Umsatzes auf Produkt B und 15 % ihres Umsatzes auf Produkt C entfallen. Die verkauften Einheiten jedes Produkts entsprechen jedoch denen, die in angezeigt werden die folgende Tabelle. Analysieren Sie, ob sich die theoretischen Daten des Eigentümers statistisch von den tatsächlich erfassten Daten unterscheiden.
Produkt | Beobachtete Verkäufe (O i ) |
---|---|
Produkt A | 453 |
Produkt B | 268 |
Produkt C | 79 |
Gesamt | 800 |
Um festzustellen, ob die beobachteten Werte den erwarteten Werten entsprechen, führen wir einen Anpassungstest durch. Die Nullhypothese und Alternativhypothese des Tests sind:
In diesem Fall verwenden wir für den Test ein Konfidenzniveau von 95 %, sodass das Signifikanzniveau 5 % beträgt.
Um die erwarteten Verkaufswerte zu ermitteln, müssen wir den Prozentsatz der erwarteten Verkäufe jedes Produkts mit der Anzahl der Gesamtverkäufe multiplizieren:
Daher lautet die Problemhäufigkeitstabelle wie folgt:
Produkt | Beobachtete Verkäufe (O i ) | Erwarteter Umsatz (E i ) |
---|---|---|
Produkt A | 453 | 400 |
Produkt B | 268 | 280 |
Produkt C | 79 | 120 |
Gesamt | 800 | 800 |
Nachdem wir nun alle Werte berechnet haben, wenden wir die Chi-Quadrat-Testformel an, um die Teststatistik zu berechnen:
Sobald der Wert der Teststatistik berechnet ist, verwenden wir die Chi-Quadrat-Verteilungstabelle, um den kritischen Wert des Tests zu ermitteln. Die Chi-Quadrat-Verteilung hat
Freiheitsgrade und das Signifikanzniveau ist
,Noch:
Somit ist die Teststatistik (21,53) größer als der kritische Testwert (5,991), daher wird die Nullhypothese abgelehnt und die Alternativhypothese akzeptiert. Dies bedeutet, dass die Daten sehr unterschiedlich sind und der Ladenbesitzer daher andere Umsätze erwartet als tatsächlich getätigt hat.
Über den Autor
Dr. Benjamin Anderson
Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen