Populacja vs. próbka: jaka jest różnica?


Często w statystyce chcemy zbierać dane, abyśmy mogli odpowiedzieć na określone pytania badawcze.

Na przykład, możemy chcieć odpowiedzieć na następujące pytania:

1. Jaki jest średni dochód gospodarstwa domowego w Miami na Florydzie?

2. Jaka jest średnia waga określonej populacji żółwi?

3. Jaki procent mieszkańców danego powiatu popiera określone prawo?

W każdym scenariuszu chcemy odpowiedzieć na pytanie dotyczące populacji , która reprezentuje wszystkie możliwe indywidualne elementy, które chcemy zmierzyć.

Zamiast jednak gromadzić dane na temat każdej osoby w populacji, zamiast tego zbieramy dane na temat próby populacji, która reprezentuje część populacji.

Populacja : każdy możliwy pojedynczy element, który chcemy zmierzyć.

Próba: Część populacji.

Oto przykład populacji w porównaniu z próbą w trzech przykładach wprowadzających.

Przykład 1: Jaki jest średni dochód gospodarstwa domowego w Miami na Florydzie?

Cała populacja może składać się z 500 000 gospodarstw domowych, ale możemy zbierać dane tylko na próbie łącznie 2 000 gospodarstw domowych.

Populacja vs. próbka

2. Jaka jest średnia waga określonej populacji żółwi?

Całkowita populacja może obejmować 800 żółwi, ale mogliśmy zebrać dane jedynie na temat próby 30 żółwi.

Różnica między populacją a próbą

3. Jaki procent mieszkańców danego powiatu popiera określone prawo?

Całkowita populacja może wynosić 50 000, ale możemy zebrać dane tylko na próbie 1000 osób.

Przykład populacji vs. próbka

Dlaczego warto używać próbek?

Istnieje kilka powodów, dla których zazwyczaj gromadzimy dane na próbkach, a nie na całych populacjach, w tym:

1 . Zbieranie danych na temat całej populacji zajmuje zbyt dużo czasu . Na przykład, jeśli chcemy poznać średni dochód gospodarstwa domowego w Miami na Florydzie, zebranie dochodów każdego gospodarstwa domowego może zająć miesiące, a nawet lata. Do czasu, gdy zbierzemy wszystkie te dane, populacja może się zmienić lub pytanie badawcze, które nas interesuje, może już nie istnieć.

2. Gromadzenie danych dotyczących całej populacji jest zbyt kosztowne. Gromadzenie danych dotyczących każdej osoby w populacji jest często zbyt kosztowne, dlatego zamiast tego decydujemy się na gromadzenie danych na próbie.

3. Nie da się zebrać danych o całej populacji. W wielu przypadkach po prostu nie jest możliwe zebranie danych dotyczących każdej osoby w populacji. Na przykład niezwykle trudne może być znalezienie i zważenie każdego żółwia w określonej populacji.

Zbierając dane na próbach, jesteśmy w stanie znacznie szybciej i mniejszym kosztem zebrać informacje o danej populacji.

A jeśli nasza próba jest reprezentatywna dla populacji , możemy z dużym poziomem pewności uogólnić wyniki z jednej próby na większą populację.

Znaczenie próbek reprezentatywnych

Kiedy zbieramy próbkę z populacji, w idealnym przypadku chcielibyśmy, aby próbka przypominała „miniwersję” naszej populacji.

Załóżmy na przykład, że chcemy poznać preferencje dotyczące filmów uczniów w określonym okręgu szkolnym, w którym uczy się ogółem 5000 uczniów. Ponieważ badanie każdego ucznia indywidualnie zajęłoby zbyt dużo czasu, moglibyśmy zamiast tego wybrać próbę 100 uczniów i zapytać ich o ich preferencje.

Jeżeli ogólna populacja uczniów składa się z 50% dziewcząt i 50% chłopców, nasza próba nie byłaby reprezentatywna, gdyby obejmowała 90% chłopców i tylko 10% dziewcząt.

Reprezentatywna próbka populacji

Lub jeśli ogólna populacja składa się w równych częściach ze studentów pierwszego roku, drugiego roku, juniorów i seniorów, wówczas nasza próba nie byłaby reprezentatywna, gdyby obejmowała tylko studentów pierwszego roku.

Próba jest reprezentatywna dla populacji, jeśli cechy osobników w próbie ściśle odpowiadają cechom osobników w całej populacji.

Kiedy tak się stanie, możemy śmiało uogólnić wyniki z próby na całą populację.

Jak zdobyć próbki

Istnieje wiele różnych metod, które możemy zastosować w celu uzyskania populacji próbnych.

Aby zmaksymalizować szansę na uzyskanie reprezentatywnej próbki, możemy zastosować jedną z trzech metod:

Proste pobieranie próbek losowych: losowe wybieranie osób za pomocą generatora liczb losowych lub środków doboru losowego.

Systematyczne pobieranie próbek losowych: umieść każdego członka populacji w określonej kolejności. Wybierz losowy punkt początkowy i wybierz jednego członka spośród n, który będzie częścią próbki.

Dobór losowy warstwowy: dzielenie populacji na grupy. Wybierz losowo kilku członków z każdej grupy, którzy staną się częścią próby.

W każdej z tych metod każdy osobnik w populacji ma równe prawdopodobieństwo znalezienia się w próbie. Maksymalizuje to szanse na uzyskanie próby będącej „mini wersją” populacji.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *