Cara menghitung kesalahan standar mean dengan python


Kesalahan standar mean adalah cara mengukur sebaran nilai dalam suatu kumpulan data. Ini dihitung sebagai berikut:

Kesalahan standar mean = s / √n

Emas:

  • s : deviasi standar sampel
  • n : ukuran sampel

Tutorial ini menjelaskan dua metode yang dapat Anda gunakan untuk menghitung kesalahan standar rata-rata kumpulan data dengan Python. Perhatikan bahwa kedua metode memberikan hasil yang persis sama.

Metode 1: Gunakan SciPy

Cara pertama untuk menghitung kesalahan standar mean adalah dengan menggunakan fungsi sem() dari perpustakaan SciPy Stats.

Kode berikut menunjukkan cara menggunakan fungsi ini:

 from scipy. stats import week

#define dataset 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]

#calculate standard error of the mean 
sem(data)

2.001447

Kesalahan standar rata-ratanya adalah 2.001447 .

Metode 2: Gunakan NumPy

Cara lain untuk menghitung kesalahan standar rata-rata kumpulan data adalah dengan menggunakan fungsi std() NumPy.

Perhatikan bahwa kita perlu menentukan ddof=1 dalam argumen fungsi ini untuk menghitung simpangan baku sampel dan bukan simpangan baku populasi.

Kode berikut menunjukkan cara melakukan ini:

 import numpy as np

#define dataset
data = np.array([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29])

#calculate standard error of the mean 
n.p. std (data, ddof= 1 ) / np. sqrt ( np.size (data))

2.001447

Sekali lagi, kesalahan standar rata-ratanya adalah 2.001447 .

Bagaimana menafsirkan kesalahan standar dari mean

Kesalahan standar mean hanyalah ukuran penyebaran nilai di sekitar mean. Ada dua hal yang perlu diingat ketika menafsirkan kesalahan standar mean:

1. Semakin besar kesalahan standar mean, maka nilai-nilai tersebut semakin tersebar di sekitar mean dalam suatu kumpulan data.

Untuk mengilustrasikannya, pertimbangkan jika kita mengubah nilai terakhir dari kumpulan data sebelumnya dengan angka yang jauh lebih besar:

 from scipy. stats import week

#define dataset 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ]

#calculate standard error of the mean 
sem(data)

6.978265

Perhatikan bagaimana kesalahan standar meningkat dari 2.001447 menjadi 6.978265 . Hal ini menunjukkan bahwa nilai-nilai pada dataset ini lebih tersebar disekitar mean dibandingkan dengan dataset sebelumnya.

2. Dengan bertambahnya ukuran sampel, kesalahan standar mean cenderung menurun.

Untuk mengilustrasikannya, pertimbangkan kesalahan standar dari mean untuk dua kumpulan data berikut:

 from scipy . stats import week 

#define first dataset and find SEM
data1 = [1, 2, 3, 4, 5]
sem(data1)

0.7071068

#define second dataset and find SEM
data2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5]
sem(data2)

0.4714045

Kumpulan data kedua hanyalah kumpulan data pertama yang diulang dua kali. Jadi kedua kumpulan data memiliki mean yang sama tetapi kumpulan data kedua memiliki ukuran sampel yang lebih besar sehingga memiliki kesalahan standar yang lebih kecil.

Sumber daya tambahan

Cara menghitung kesalahan standar mean di R
Cara Menghitung Standard Error Mean di Excel
Cara menghitung standard error mean di Google Sheets

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *