Was ist ein sammeltest? (definition & beispiele)
In der Statistik ist ein Omnibustest jeder statistische Test, der die Signifikanz mehrerer Parameter eines Modells gleichzeitig testet.
Angenommen, wir haben die folgenden Null- und Alternativhypothesen:
H 0 : μ 1 = μ 2 = μ 3 = … = μ k (alle Populationsmittelwerte sind gleich)
H A : Mindestens ein Bevölkerungsdurchschnitt unterscheidet sich von den anderen
Dies ist ein Beispiel für einen Omnibustest, da die Nullhypothese mehr als zwei Parameter enthält.
Wenn wir die Nullhypothese ablehnen, wissen wir, dass sich mindestens ein Populationsmittelwert von den anderen unterscheidet, aber wir wissen nicht genau, welche Populationsmittelwerte sich unterscheiden.
Ein Omnibustest kommt am häufigsten in ANOVA-Modellen und multiplen linearen Regressionsmodellen vor.
Dieses Tutorial bietet ein Beispiel für einen Omnibustest in einer einfaktoriellen ANOVA und einem multiplen linearen Regressionsmodell.
Omnibus-Test in einer einfaktoriellen ANOVA
Angenommen, ein Professor möchte wissen, ob drei verschiedene Prüfungsvorbereitungsprogramme zu unterschiedlichen Prüfungsergebnissen führen. Um dies zu testen, weist er nach dem Zufallsprinzip 10 Studenten zu, jedes Testvorbereitungsprogramm einen Monat lang zu nutzen, und führt dann die gleiche Prüfung für die Studenten jeder Gruppe durch.
Die Prüfungsergebnisse für jede Gruppe sind unten aufgeführt:
Um festzustellen, ob jedes Vorbereitungsprogramm zu den gleichen Prüfungsergebnissen führt, führt er eine einfaktorielle ANOVA unter Verwendung der folgenden Null- und Alternativhypothesen durch:
H 0 : µ 1 = µ 2 = µ 3
H A : Mindestens ein Prüfungsvorbereitungsprogramm führt zu anderen Durchschnittsnoten als die anderen.
Dies ist ein Beispiel für einen Omnibustest, da die Nullhypothese mehr als zwei Parameter hat.
Mit einem Einweg-ANOVA-Rechner kann die folgende ANOVA-Tabelle erstellt werden:
Um festzustellen, ob er die Nullhypothese ablehnen kann oder nicht, muss er sich lediglich die F-Test-Statistik und den entsprechenden p-Wert in der Tabelle ansehen.
Die F-Test-Statistik beträgt 2,358 und der entsprechende p-Wert beträgt 0,11385 . Da dieser p-Wert nicht kleiner als 0,05 ist, kann die Nullhypothese nicht abgelehnt werden.
Mit anderen Worten: Es gibt keine ausreichenden Belege dafür, dass eines der Prüfungsvorbereitungsprogramme zu unterschiedlichen durchschnittlichen Prüfungsergebnissen führt.
Hinweis: Wenn der p-Wert kleiner als 0,05 wäre, würde der Professor die Nullhypothese ablehnen. Es könnte dann Post-hoc-Tests durchführen, um genau zu bestimmen, welche Programme unterschiedliche durchschnittliche Prüfungsergebnisse erzielten.
Omnibustest in einem multiplen linearen Regressionsmodell
Angenommen, ein Professor möchte feststellen, ob die Anzahl der Lernstunden und die Anzahl der abgelegten Übungsprüfungen die Note vorhersagen können, die ein Student bei der Prüfung erhalten wird.
Um dies zu testen, sammelt er Daten von 20 Studenten und passt das folgende multiple lineare Regressionsmodell an:
Prüfungsergebnis = β 0 + β 1 (Stunden) + β 2 (Vorprüfungen)
Dieses Regressionsmodell verwendet die folgenden Null- und Alternativhypothesen:
H 0 : β 1 = β 2 = 0
H A : Mindestens ein Koeffizient ist ungleich Null.
Dies ist ein Beispiel für einen Omnibus-Test, da die Nullhypothese testet, ob mehr als ein Parameter gleichzeitig gleich Null ist.
Die folgende Regressionsausgabe in Excel zeigt die Ergebnisse dieses Regressionsmodells:
Um festzustellen, ob er die Nullhypothese ablehnen kann oder nicht, muss er sich lediglich die F-Test-Statistik und den entsprechenden p-Wert in der Tabelle ansehen.
Die F-Test-Statistik beträgt 23,46 und der entsprechende p-Wert beträgt 0,00 . Da dieser p-Wert kleiner als 0,05 ist, kann die Nullhypothese abgelehnt und daraus geschlossen werden, dass mindestens einer der Koeffizienten im Modell ungleich Null ist.
Die einfache Ablehnung der Nullhypothese dieses Sammeltests sagt jedoch nicht wirklich aus, welche Koeffizienten im Modell ungleich Null sind. Um dies festzustellen, muss er sich die p-Werte der einzelnen Koeffizienten im Modell ansehen:
- Stunden-P-Wert: 0,00
- P-Wert der Vorbereitungsprüfungen: 0,52
Dies zeigt ihm, dass Stunden ein statistisch signifikanter Indikator für die Prüfungsnote sind, Übungsprüfungen dagegen nicht.
Zusammenfassung
Hier ist eine Zusammenfassung dessen, was wir in diesem Artikel gelernt haben:
- Mit einem Omnibustest wird die Signifikanz mehrerer Modellparameter gleichzeitig getestet.
- Wenn wir die Nullhypothese eines Sammeltests ablehnen, wissen wir, dass mindestens ein Parameter im Modell signifikant ist.
- Wenn wir die Nullhypothese eines ANOVA-Modells ablehnen, können wir Post-hoc-Tests verwenden, um zu bestimmen, welche Populationsmittelwerte tatsächlich unterschiedlich sind.
- Wenn wir die Nullhypothese eines multiplen linearen Regressionsmodells ablehnen, können wir die p-Werte der einzelnen Koeffizienten im Modell untersuchen, um zu bestimmen, welche davon statistisch signifikant sind.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie eine einfache ANOVA und eine multiple lineare Regression in Excel durchführen:
So führen Sie eine einfaktorielle ANOVA in Excel durch
So führen Sie eine multiple lineare Regression in Excel durch