Jak obliczyć wariancję próbki i populacji w pythonie


Wariancja to sposób pomiaru rozkładu wartości w zbiorze danych.

Wzór na obliczenie wariancji populacji jest następujący:

σ 2 = Σ (x i – μ) 2 / N

Złoto:

  • Σ : Symbol oznaczający „sumę”
  • μ : średnia populacji
  • x i : I- ty element populacji
  • N : Wielkość populacji

Wzór na obliczenie wariancji próbki jest następujący:

s 2 = Σ (x jax ) 2 / (n-1)

Złoto:

  • x : średnia próbki
  • x i : I- ty element próbki
  • n : Rozmiar próbki

Możemy użyć funkcji wariancji i pwariancji z biblioteki statystycznej w Pythonie, aby szybko obliczyć (odpowiednio) wariancję próbki i wariancję populacji dla danej tabeli.

 from statistics import variance, pvariance

#calculate sample variance
variance(s)

#calculate population variance
pvariance(x)

Poniższe przykłady pokazują, jak wykorzystać każdą funkcję w praktyce.

Przykład 1: Obliczanie wariancji próbki w Pythonie

Poniższy kod pokazuje, jak obliczyć przykładową wariancję tabeli w Pythonie:

 from statistics import variance 

#define data
data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14]

#calculate sample variance
variance(data)

22,067

Wariancja próbki wynosi 22,067 .

Przykład 2: Obliczanie wariancji populacji w Pythonie

Poniższy kod pokazuje, jak obliczyć wariancję populacji tabeli w Pythonie:

 from statistics import pvariance 

#define data
data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14]

#calculate sample variance
pvariance(data)

20,596

Wariancja populacji wynosi 20 596 .

Uwagi dotyczące obliczania wariancji próby i populacji

Obliczając wariancję próby i populacji, należy pamiętać o następujących kwestiach:

  • Wariancję populacji należy obliczyć, gdy zbiór danych, z którym pracujesz, reprezentuje całą populację, czyli każdą wartość, która Cię interesuje.
  • Wariancję próbki należy obliczyć, gdy zbiór danych, z którym pracujesz, reprezentuje próbkę pobraną z większej populacji będącej przedmiotem zainteresowania.
  • Wariancja próbki w danej tabeli danych będzie zawsze większa niż wariancja populacji dla tej samej tabeli danych, ponieważ przy obliczaniu wariancji próbki występuje większa niepewność, dlatego nasze oszacowanie wariancji będzie większe.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak obliczyć inne metryki spreadu w Pythonie:

Jak obliczyć rozstęp międzykwartylowy w Pythonie
Jak obliczyć współczynnik zmienności w Pythonie
Jak obliczyć odchylenie standardowe listy w Pythonie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *