Jak obliczyć wariancję próbki i populacji w pythonie
Wariancja to sposób pomiaru rozkładu wartości w zbiorze danych.
Wzór na obliczenie wariancji populacji jest następujący:
σ 2 = Σ (x i – μ) 2 / N
Złoto:
- Σ : Symbol oznaczający „sumę”
- μ : średnia populacji
- x i : I- ty element populacji
- N : Wielkość populacji
Wzór na obliczenie wariancji próbki jest następujący:
s 2 = Σ (x ja – x ) 2 / (n-1)
Złoto:
- x : średnia próbki
- x i : I- ty element próbki
- n : Rozmiar próbki
Możemy użyć funkcji wariancji i pwariancji z biblioteki statystycznej w Pythonie, aby szybko obliczyć (odpowiednio) wariancję próbki i wariancję populacji dla danej tabeli.
from statistics import variance, pvariance #calculate sample variance variance(s) #calculate population variance pvariance(x)
Poniższe przykłady pokazują, jak wykorzystać każdą funkcję w praktyce.
Przykład 1: Obliczanie wariancji próbki w Pythonie
Poniższy kod pokazuje, jak obliczyć przykładową wariancję tabeli w Pythonie:
from statistics import variance #define data data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14] #calculate sample variance variance(data) 22,067
Wariancja próbki wynosi 22,067 .
Przykład 2: Obliczanie wariancji populacji w Pythonie
Poniższy kod pokazuje, jak obliczyć wariancję populacji tabeli w Pythonie:
from statistics import pvariance #define data data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14] #calculate sample variance pvariance(data) 20,596
Wariancja populacji wynosi 20 596 .
Uwagi dotyczące obliczania wariancji próby i populacji
Obliczając wariancję próby i populacji, należy pamiętać o następujących kwestiach:
- Wariancję populacji należy obliczyć, gdy zbiór danych, z którym pracujesz, reprezentuje całą populację, czyli każdą wartość, która Cię interesuje.
- Wariancję próbki należy obliczyć, gdy zbiór danych, z którym pracujesz, reprezentuje próbkę pobraną z większej populacji będącej przedmiotem zainteresowania.
- Wariancja próbki w danej tabeli danych będzie zawsze większa niż wariancja populacji dla tej samej tabeli danych, ponieważ przy obliczaniu wariancji próbki występuje większa niepewność, dlatego nasze oszacowanie wariancji będzie większe.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak obliczyć inne metryki spreadu w Pythonie:
Jak obliczyć rozstęp międzykwartylowy w Pythonie
Jak obliczyć współczynnik zmienności w Pythonie
Jak obliczyć odchylenie standardowe listy w Pythonie