Cara menghitung varians sampel & populasi dengan python


Varians adalah cara untuk mengukur sebaran nilai dalam suatu kumpulan data.

Rumus untuk menghitung varians populasi adalah:

σ 2 = Σ ( xi – μ) 2 / N

Emas:

  • Σ : Simbol yang berarti “jumlah”
  • μ : Rata-rata populasi
  • x i : Elemen ke- i dari populasi
  • N : Ukuran populasi

Rumus untuk menghitung varians sampel adalah:

s 2 = Σ ( xix ) 2 / (n-1)

Emas:

  • x : mean sampel
  • x i : Elemen ke- i dari sampel
  • n : Ukuran sampel

Kita dapat menggunakan fungsi varians dan pvarians dari perpustakaan statistik dengan Python untuk menghitung dengan cepat varians sampel dan varians populasi (masing-masing) untuk tabel tertentu.

 from statistics import variance, pvariance

#calculate sample variance
variance(s)

#calculate population variance
pvariance(x)

Contoh berikut menunjukkan cara menggunakan setiap fungsi dalam praktik.

Contoh 1: Menghitung Varians Sampel dengan Python

Kode berikut menunjukkan cara menghitung varians sampel tabel dengan Python:

 from statistics import variance 

#define data
data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14]

#calculate sample variance
variance(data)

22,067

Varians sampelnya ternyata 22.067 .

Contoh 2: Menghitung Varians Populasi dengan Python

Kode berikut menunjukkan cara menghitung varians populasi suatu tabel dengan Python:

 from statistics import pvariance 

#define data
data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14]

#calculate sample variance
pvariance(data)

20,596

Varians populasinya ternyata 20.596 .

Catatan tentang Menghitung Varians Sampel dan Populasi

Ingatlah hal berikut saat menghitung varians sampel dan populasi:

  • Anda harus menghitung varians populasi ketika kumpulan data yang Anda gunakan mewakili seluruh populasi, yaitu setiap nilai yang Anda minati.
  • Anda harus menghitung varians sampel ketika kumpulan data yang Anda gunakan mewakili sampel yang diambil dari populasi yang lebih besar.
  • Varians sampel suatu tabel data tertentu akan selalu lebih besar daripada varians populasi untuk tabel data yang sama karena terdapat lebih banyak ketidakpastian saat menghitung varians sampel, sehingga estimasi varians kita akan lebih besar.

Sumber daya tambahan

Tutorial berikut menjelaskan cara menghitung metrik spread lainnya dengan Python:

Cara menghitung rentang interkuartil dengan Python
Cara Menghitung Koefisien Variasi dengan Python
Cara menghitung deviasi standar daftar dengan Python

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *