Cara menghitung varians sampel & populasi dengan python
Varians adalah cara untuk mengukur sebaran nilai dalam suatu kumpulan data.
Rumus untuk menghitung varians populasi adalah:
σ 2 = Σ ( xi – μ) 2 / N
Emas:
- Σ : Simbol yang berarti “jumlah”
- μ : Rata-rata populasi
- x i : Elemen ke- i dari populasi
- N : Ukuran populasi
Rumus untuk menghitung varians sampel adalah:
s 2 = Σ ( xi – x ) 2 / (n-1)
Emas:
- x : mean sampel
- x i : Elemen ke- i dari sampel
- n : Ukuran sampel
Kita dapat menggunakan fungsi varians dan pvarians dari perpustakaan statistik dengan Python untuk menghitung dengan cepat varians sampel dan varians populasi (masing-masing) untuk tabel tertentu.
from statistics import variance, pvariance #calculate sample variance variance(s) #calculate population variance pvariance(x)
Contoh berikut menunjukkan cara menggunakan setiap fungsi dalam praktik.
Contoh 1: Menghitung Varians Sampel dengan Python
Kode berikut menunjukkan cara menghitung varians sampel tabel dengan Python:
from statistics import variance #define data data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14] #calculate sample variance variance(data) 22,067
Varians sampelnya ternyata 22.067 .
Contoh 2: Menghitung Varians Populasi dengan Python
Kode berikut menunjukkan cara menghitung varians populasi suatu tabel dengan Python:
from statistics import pvariance #define data data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14] #calculate sample variance pvariance(data) 20,596
Varians populasinya ternyata 20.596 .
Catatan tentang Menghitung Varians Sampel dan Populasi
Ingatlah hal berikut saat menghitung varians sampel dan populasi:
- Anda harus menghitung varians populasi ketika kumpulan data yang Anda gunakan mewakili seluruh populasi, yaitu setiap nilai yang Anda minati.
- Anda harus menghitung varians sampel ketika kumpulan data yang Anda gunakan mewakili sampel yang diambil dari populasi yang lebih besar.
- Varians sampel suatu tabel data tertentu akan selalu lebih besar daripada varians populasi untuk tabel data yang sama karena terdapat lebih banyak ketidakpastian saat menghitung varians sampel, sehingga estimasi varians kita akan lebih besar.
Sumber daya tambahan
Tutorial berikut menjelaskan cara menghitung metrik spread lainnya dengan Python:
Cara menghitung rentang interkuartil dengan Python
Cara Menghitung Koefisien Variasi dengan Python
Cara menghitung deviasi standar daftar dengan Python