Centralne twierdzenie graniczne: cztery warunki do spełnienia
Centralne twierdzenie graniczne stwierdza, że rozkład próbkowania średniej próbki jest w przybliżeniu normalny, jeśli wielkość próby jest wystarczająco duża, nawet jeśli rozkład populacji nie jest normalny .
Aby zastosować centralne twierdzenie graniczne, muszą być spełnione cztery warunki:
1. Randomizacja : Dane należy dobierać losowo, tak aby każdy członek populacji miał równe prawdopodobieństwo, że zostanie wybrany do próby.
2. Niezależność: Wartości próbek muszą być od siebie niezależne.
3. Warunek 10%: w przypadku losowania próby bez zastępowania liczebność próby nie powinna przekraczać 10% populacji.
4. Warunek dużej próbki: Wielkość próbki powinna być wystarczająco duża.
Ten samouczek zawiera krótkie wyjaśnienie każdego warunku.
Warunek 1: randomizacja
Aby zastosować centralne twierdzenie graniczne, dane, których używamy, muszą zostać losowo wybrane z populacji przy użyciu metody próbkowania prawdopodobieństwa .
W statystyce wyróżnia się dwa rodzaje metod pobierania próbek :
1. Metody doboru probabilistycznego: Metody doboru próby, w których każdy członek populacji ma równe prawdopodobieństwo, że zostanie wybrany do próby. Przykłady obejmują:
- Prosta losowa próbka
- Stratyfikowana próbka losowa
- Skupiona próbka losowa
- Systematyczne pobieranie próbek losowych
2. Metody doboru nieprobabilistycznego: metody doboru próby, w których prawdopodobieństwo znalezienia się w próbie nie jest takie samo dla każdego członka populacji. Przykłady obejmują:
- Wygodna próbka
- Próbka dobrowolnej odpowiedzi
- Próbka śnieżki
- Czysta próbka
Do uzyskania próby ważne jest zastosowanie metody doboru probabilistycznego, gdyż maksymalizuje to szanse na uzyskanie reprezentatywnej próby z populacji .
Warunek 2: Niezależność
Aby zastosować centralne twierdzenie graniczne, musimy także założyć, że każda z wartości w próbie jest od siebie niezależna. Innymi słowy, wystąpienie jednego zdarzenia nie wpływa na wystąpienie innego zdarzenia.
Założenie to jest często spełnione, jeśli zastosujemy metodę próbkowania prawdopodobieństwa, ponieważ tego rodzaju metody próbkowania wybierają obserwacje, które mają zostać uwzględnione w próbie, całkowicie niezależnie od siebie.
Warunek 3: warunek 10%.
Jeżeli próba jest pobierana bez zastępowania (co prawie zawsze ma miejsce), wielkość próby nie powinna przekraczać 10% całkowitej populacji.
Na przykład:
- Jeśli wielkość naszej populacji wynosi 500 osób, wówczas wielkość naszej próby nie powinna przekraczać 50 osób.
- Jeśli nasza populacja wynosi 1000 osób, nasza próba nie powinna przekraczać 100 osób.
- Jeśli wielkość naszej populacji wynosi 50 000 osób, wielkość naszej próby nie powinna przekraczać 5000 osób.
I tak dalej.
Warunek 4: Warunek dużej próbki
Wreszcie, aby zastosować centralne twierdzenie graniczne, wielkość naszej próby musi być wystarczająco duża.
Ogólnie rzecz biorąc, uważamy, że „wystarczająco duży”, aby mieć 30 lub więcej. Jednak liczba ta może się nieznacznie różnić w zależności od podstawowego kształtu rozmieszczenia populacji.
Zwłaszcza:
- Jeśli rozkład populacji jest symetryczny, czasami wystarczająca jest wielkość próby wynosząca zaledwie 15 osób.
- Jeśli rozkład populacji jest nierówny, zwykle konieczna jest próba licząca co najmniej 30 osób.
- Jeżeli rozkład populacji jest wyjątkowo nierówny, konieczna może być próba licząca 40 lub więcej osób.
W zależności od kształtu rozkładu populacji, do zastosowania centralnego twierdzenia granicznego może być potrzebna próbka większa lub mniejsza niż 30.