Hypothesentest und konfidenzintervall: was ist der unterschied?
Zwei der am häufigsten verwendeten Verfahren in der Statistik sind Hypothesentests und Konfidenzintervalle .
Hier ist der Unterschied zwischen den beiden:
- Ein Hypothesentest ist ein formaler statistischer Test, mit dem festgestellt wird, ob eine Hypothese über einen Populationsparameter wahr ist.
- Ein Konfidenzintervall ist ein Wertebereich, der wahrscheinlich einen Populationsparameter mit einem bestimmten Konfidenzniveau enthält.
Dieses Tutorial gibt einen kurzen Überblick über die einzelnen Methoden sowie ihre Gemeinsamkeiten und Unterschiede.
Die Grundlagen des Hypothesentests
Eine Testhypothese wird verwendet, um zu testen, ob eine Hypothese über einen Populationsparameter wahr ist oder nicht.
Um reale Hypothesentests durchzuführen, erhalten Forscher eine Zufallsstichprobe der Bevölkerung und führen einen Hypothesentest an den Stichprobendaten durch, wobei sie eine Null- und Alternativhypothese verwenden:
- Nullhypothese (H 0 ): Die Stichprobendaten stammen allein durch Zufall.
- Alternativhypothese ( HA ): Die Stichprobendaten werden durch eine nicht zufällige Ursache beeinflusst.
Wenn der p-Wert des Hypothesentests unter einem bestimmten Signifikanzniveau liegt (z. B. α = 0,05), können wir die Nullhypothese ablehnen und daraus schließen, dass wir über ausreichende Beweise verfügen, um anzugeben, dass die Alternativhypothese wahr ist.
Beispiel für einen Hypothesentest
Angenommen, eine Produktionsanlage möchte testen, ob sich durch eine neue Methode die Anzahl der pro Monat produzierten fehlerhaften Widgets ändert, die derzeit bei 250 liegt.
Um dies zu testen, können sie die durchschnittliche Anzahl fehlerhafter Widgets messen, die vor und nach einem Monat mit der neuen Methode produziert wurden.
Sie können einen Hypothesentest anhand der folgenden Hypothesen durchführen:
- H 0 : μ nachher = μ vorher (die durchschnittliche Anzahl fehlerhafter Widgets ist vor und nach der neuen Methode gleich)
- H A : μ nach ≠ μ vorher (die durchschnittliche Anzahl der produzierten fehlerhaften Widgets ist vor und nach der neuen Methode unterschiedlich)
Nehmen wir an, sie führen einen t-Test bei einer Stichprobe durch und erhalten einen p-Wert von 0,0032.
Da dieser p-Wert kleiner als α = 0,05 ist, kann die Einrichtung die Nullhypothese ablehnen und daraus schließen, dass die neue Methode zu einer Änderung der Anzahl fehlerhafter Widgets führt, die pro Monat produziert werden.
Die Grundlagen von Konfidenzintervallen
Ein Konfidenzintervall ist ein Wertebereich, der wahrscheinlich einen Populationsparameter mit einem bestimmten Konfidenzniveau enthält.
Um ein reales Konfidenzintervall zu berechnen, erhalten Forscher eine Zufallsstichprobe der Grundgesamtheit und verwenden die folgende Formel, um ein Konfidenzintervall für den Mittelwert der Grundgesamtheit zu berechnen:
Konfidenzintervall = x +/- z*(s/√ n )
Gold:
- x : Stichprobenmittelwert
- z: der gewählte z-Wert
- s: Stichprobenstandardabweichung
- n: Stichprobengröße
Der von Ihnen verwendete Z-Wert hängt vom gewählten Konfidenzniveau ab. Die folgende Tabelle zeigt den Z-Wert, der den häufigsten Konfidenzniveauoptionen entspricht:
Ein Maß an Selbstvertrauen | z-Wert |
---|---|
0,90 | 1.645 |
0,95 | 1,96 |
0,99 | 2,58 |
Beispiel für ein Konfidenzintervall
Angenommen, ein Biologe möchte das durchschnittliche Gewicht von Schildkröten in einer bestimmten Population schätzen und sammelt eine Zufallsstichprobe von Schildkröten mit den folgenden Informationen:
- Stichprobengröße n = 25
- Durchschnittliches Probengewicht x = 300
- Stichprobenstandardabweichung s = 18,5
So berechnen Sie das 90 %-Konfidenzintervall für das tatsächliche Durchschnittsgewicht der Bevölkerung:
90 %-Konfidenzintervall: 300 +/- 1,645*(18,5/√25) = [293,91, 306,09]
Der Biologe kann zu 90 % sicher sein, dass das tatsächliche Durchschnittsgewicht einer Schildkröte in dieser Population zwischen 293,1 Pfund und 306,09 Pfund liegt.
Hypothesentest versus Konfidenzintervall: Wann man jedes verwendet
Die Entscheidung, einen Hypothesentest oder ein Konfidenzintervall zu verwenden, hängt von der Frage ab, die Sie beantworten möchten.
Sie müssen ein Konfidenzintervall verwenden, wenn Sie den Wert eines Populationsparameters schätzen möchten.
Sie sollten Hypothesentests verwenden, wenn Sie feststellen möchten, ob eine Hypothese über einen Populationsparameter wahrscheinlich wahr ist oder nicht.
Um Ihr Wissen darüber zu testen, wann die einzelnen Verfahren anzuwenden sind, betrachten Sie die folgenden Szenarios.
Szenario 1: Stundenlanges Lernen
Angenommen, ein Universitätsforscher möchte die durchschnittliche Anzahl der Stunden, die Studierende pro Woche mit Lernen verbringen, messen.
Mit welchem Verfahren soll sie diese Frage beantworten?
Sie sollte ein Konfidenzintervall verwenden, da sie den Wert eines Populationsparameters schätzen möchte.
Szenario 2: Neues Medikament
Angenommen, ein Arzt möchte testen, ob ein neues Medikament den Blutdruck stärker senken kann als das derzeitige Standardmedikament.
Welches Verfahren sollte er zur Beantwortung dieser Frage anwenden?
Er sollte Hypothesentests verwenden, weil er verstehen möchte, ob eine bestimmte Hypothese bezüglich eines Populationsparameters wahr ist oder nicht.
Zusätzliche Ressourcen
Die folgenden Tutorials bieten zusätzliche Informationen zum Hypothesentest :
Einführung in das Testen von Hypothesen
Einführung in den T-Test bei einer Stichprobe
Einführung in den T-Test bei zwei Stichproben
Einführung in den T-Test für gepaarte Stichproben
Die folgenden Tutorials bieten zusätzliche Informationen zu Konfidenzintervallen :
Einführung in Konfidenzintervalle
Konfidenzintervall für einen Mittelwert
Konfidenzintervall für einen Anteil