Wariancja próbki vs. wariancja populacji: jaka jest różnica?
Wariancja to sposób pomiaru rozkładu wartości w zbiorze danych.
Wzór na obliczenie wariancji populacji jest następujący:
σ 2 = Σ (x i – μ) 2 / N
Złoto:
- Σ : Symbol oznaczający „sumę”
- μ : średnia populacji
- x i : I- ty element populacji
- N : Wielkość populacji
Wzór na obliczenie wariancji próbki jest następujący:
s 2 = Σ (x ja – x ) 2 / (n-1)
Złoto:
- x : przykładowe środki
- x i : I- ty element próbki
- n : Rozmiar próbki
Należy pamiętać, że istnieje tylko niewielka różnica między tymi dwoma formułami:
Kiedy obliczamy wariancję populacji, dzielimy przez N (wielkość populacji).
Obliczając wariancję próby, dzielimy przez n-1 (wielkość próby – 1).
Przy obliczaniu wariancji próbki stosujemy tak zwaną poprawkę Bessela , która polega na dzieleniu przez n-1.
Nie wdając się w szczegóły matematyczne, dzielenie przez n-1 może okazać się obiektywnym oszacowaniem wariancji populacji, która i tak jest wartością, która i tak zwykle nas interesuje.
Kiedy obliczać wariancję próbki a wariancję populacji
Jeśli nie masz pewności, czy obliczyć wariancję próbki, czy wariancję populacji, pamiętaj o tej ogólnej zasadzie:
Wariancję próbki należy obliczyć, gdy zbiór danych, z którym pracujesz, reprezentuje próbkę pobraną z większej populacji będącej przedmiotem zainteresowania.
Wariancję populacji należy obliczyć, gdy zbiór danych, z którym pracujesz, reprezentuje całą populację, czyli każdą wartość, która Cię interesuje.
Poniższe przykłady pokazują różne scenariusze obliczania wariancji próbki w porównaniu z wariancją populacji.
Przykład: Obliczanie wariancji próbki
Załóżmy, że botanik chce obliczyć różnicę wysokości określonego gatunku rośliny. Ponieważ na danym obszarze rosną tysiące pojedynczych roślin, postanawia pobrać prostą losową próbkę 20 roślin i zmierzyć każdą z nich.
W tym scenariuszu botanik musi obliczyć wariancję próbki , ponieważ interesuje go wariancja całej populacji roślin, ale po prostu wykorzystuje tę próbkę do oszacowania prawdziwej wariancji populacji.
Przykład: obliczanie wariancji populacji
Załóżmy, że nauczyciel chce obliczyć wariancję wyników egzaminu 20 uczniów w swojej klasie.
W tym scenariuszu nauczyciel musi obliczyć wariancję populacji , ponieważ zbiór danych, z którym pracuje (20 wyników egzaminu) reprezentuje całą populację będącą przedmiotem zainteresowania.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak obliczyć wariancję próbki i wariancję populacji w różnych programach statystycznych:
Jak obliczyć wariancję próby i populacji w programie Excel
Jak obliczyć wariancję próby i populacji w R
Jak obliczyć wariancję próbki i populacji w Pythonie