Stan dużej próbki: definicja i przykład
W statystyce często chcemy używaćpróbek do wyciągania wniosków na temat populacji na podstawietestowania hipotez lub przedziałów ufności .
Większość wzorów, których używamy do testowania hipotez i przedziałów ufności, zakłada, że dana próbka ma w przybliżeniu rozkład normalny .
Aby jednak bezpiecznie sformułować tę hipotezę, musimy upewnić się, że wielkość naszej próby jest wystarczająco duża. W szczególności musimy upewnić się, że spełniony jest warunek dużej próbki .
Warunek dużej próbki: wielkość próbki wynosi co najmniej 30.
Uwaga: w niektórych podręcznikach „wystarczająco duża” wielkość próby jest zdefiniowana jako co najmniej 40, ale częściej używa się liczby 30.
Gdy ten warunek jest spełniony, można założyć, że rozkład próbkowania średnich z próbki jest w przybliżeniu normalny. Założenie to pozwala nam wykorzystać próbki do wyciągnięcia wniosków na temat populacji, z których zostały pobrane.
Powodem użycia liczby 30 jest centralne twierdzenie graniczne. Więcej na ten temat możesz przeczytać w tym poście na blogu .
Przykład: Sprawdzanie statusu dużej próbki
Załóżmy, że pewna maszyna tworzy krakersy. Rozkład masy tych ciasteczek jest przesunięty w prawo, średnio 10 uncji i odchylenie standardowe 2 uncje. Jeśli weźmiemy prostą losową próbkę 100 ciasteczek wyprodukowanych przez to urządzenie, jakie jest prawdopodobieństwo, że średnia waga ciasteczek w tej próbce jest mniejsza niż 9,8 uncji?
Aby odpowiedzieć na to pytanie, możemy użyć normalnego kalkulatora CDF , ale najpierw musimy sprawdzić, czy wielkość próby jest wystarczająco duża, aby założyć, że rozkład średniej próbkowania jest normalny.
W tym przykładzie wielkość naszej próby wynosi n = 100 , czyli znacznie więcej niż 30. Pomimo faktu, że prawdziwy rozkład masy ciasteczek jest przesunięty w prawo, ponieważ wielkość naszej próby jest „wystarczająco duża”, możemy założyć, że rozkład średniej próbki jest normalna. Moglibyśmy zatem bezpiecznie użyć normalnego kalkulatora CDF do rozwiązania tego problemu.
Zmiany stanu dużych próbek
Często wielkość próby uważa się za „wystarczająco dużą”, jeśli jest większa lub równa 30, ale liczba ta może się nieznacznie różnić w zależności od podstawowego kształtu rozkładu populacji.
Zwłaszcza:
- Jeśli rozkład populacji jest symetryczny, czasami wystarczająca jest wielkość próby wynosząca zaledwie 15 osób.
- Jeśli rozkład populacji jest nierówny, zwykle konieczna jest próba licząca co najmniej 30 osób.
- Jeżeli rozkład populacji jest wyjątkowo nierówny, konieczna może być próba licząca 40 lub więcej osób.
W zależności od kształtu rozkładu populacji, do zastosowania centralnego twierdzenia granicznego może być potrzebna próbka większa lub mniejsza niż 30.
Dodatkowe zasoby
Wprowadzenie do centralnego twierdzenia granicznego
Wprowadzenie do rozkładów próbkowania