Wariancja próbki vs. wariancja populacji: jaka jest różnica?


Wariancja to sposób pomiaru rozkładu wartości w zbiorze danych.

Wzór na obliczenie wariancji populacji jest następujący:

σ 2 = Σ (x i – μ) 2 / N

Złoto:

  • Σ : Symbol oznaczający „sumę”
  • μ : średnia populacji
  • x i : I- ty element populacji
  • N : Wielkość populacji

Wzór na obliczenie wariancji próbki jest następujący:

s 2 = Σ (x jax ) 2 / (n-1)

Złoto:

  • x : przykładowe środki
  • x i : I- ty element próbki
  • n : Rozmiar próbki

Należy pamiętać, że istnieje tylko niewielka różnica między tymi dwoma formułami:

Kiedy obliczamy wariancję populacji, dzielimy przez N (wielkość populacji).

Obliczając wariancję próby, dzielimy przez n-1 (wielkość próby – 1).

Przy obliczaniu wariancji próbki stosujemy tak zwaną poprawkę Bessela , która polega na dzieleniu przez n-1.

Nie wdając się w szczegóły matematyczne, dzielenie przez n-1 może okazać się obiektywnym oszacowaniem wariancji populacji, która i tak jest wartością, która i tak zwykle nas interesuje.

Kiedy obliczać wariancję próbki a wariancję populacji

Jeśli nie masz pewności, czy obliczyć wariancję próbki, czy wariancję populacji, pamiętaj o tej ogólnej zasadzie:

Wariancję próbki należy obliczyć, gdy zbiór danych, z którym pracujesz, reprezentuje próbkę pobraną z większej populacji będącej przedmiotem zainteresowania.

Wariancję populacji należy obliczyć, gdy zbiór danych, z którym pracujesz, reprezentuje całą populację, czyli każdą wartość, która Cię interesuje.

Poniższe przykłady pokazują różne scenariusze obliczania wariancji próbki w porównaniu z wariancją populacji.

Przykład: Obliczanie wariancji próbki

Załóżmy, że botanik chce obliczyć różnicę wysokości określonego gatunku rośliny. Ponieważ na danym obszarze rosną tysiące pojedynczych roślin, postanawia pobrać prostą losową próbkę 20 roślin i zmierzyć każdą z nich.

W tym scenariuszu botanik musi obliczyć wariancję próbki , ponieważ interesuje go wariancja całej populacji roślin, ale po prostu wykorzystuje tę próbkę do oszacowania prawdziwej wariancji populacji.

Przykład: obliczanie wariancji populacji

Załóżmy, że nauczyciel chce obliczyć wariancję wyników egzaminu 20 uczniów w swojej klasie.

W tym scenariuszu nauczyciel musi obliczyć wariancję populacji , ponieważ zbiór danych, z którym pracuje (20 wyników egzaminu) reprezentuje całą populację będącą przedmiotem zainteresowania.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak obliczyć wariancję próbki i wariancję populacji w różnych programach statystycznych:

Jak obliczyć wariancję próby i populacji w programie Excel
Jak obliczyć wariancję próby i populacji w R
Jak obliczyć wariancję próbki i populacji w Pythonie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *