Cara menghitung kesalahan standar mean dengan python
Kesalahan standar mean adalah cara mengukur sebaran nilai dalam suatu kumpulan data. Ini dihitung sebagai berikut:
Kesalahan standar mean = s / √n
Emas:
- s : deviasi standar sampel
- n : ukuran sampel
Tutorial ini menjelaskan dua metode yang dapat Anda gunakan untuk menghitung kesalahan standar rata-rata kumpulan data dengan Python. Perhatikan bahwa kedua metode memberikan hasil yang persis sama.
Metode 1: Gunakan SciPy
Cara pertama untuk menghitung kesalahan standar mean adalah dengan menggunakan fungsi sem() dari perpustakaan SciPy Stats.
Kode berikut menunjukkan cara menggunakan fungsi ini:
from scipy. stats import week #define dataset data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29] #calculate standard error of the mean sem(data) 2.001447
Kesalahan standar rata-ratanya adalah 2.001447 .
Metode 2: Gunakan NumPy
Cara lain untuk menghitung kesalahan standar rata-rata kumpulan data adalah dengan menggunakan fungsi std() NumPy.
Perhatikan bahwa kita perlu menentukan ddof=1 dalam argumen fungsi ini untuk menghitung simpangan baku sampel dan bukan simpangan baku populasi.
Kode berikut menunjukkan cara melakukan ini:
import numpy as np #define dataset data = np.array([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]) #calculate standard error of the mean n.p. std (data, ddof= 1 ) / np. sqrt ( np.size (data)) 2.001447
Sekali lagi, kesalahan standar rata-ratanya adalah 2.001447 .
Bagaimana menafsirkan kesalahan standar dari mean
Kesalahan standar mean hanyalah ukuran penyebaran nilai di sekitar mean. Ada dua hal yang perlu diingat ketika menafsirkan kesalahan standar mean:
1. Semakin besar kesalahan standar mean, maka nilai-nilai tersebut semakin tersebar di sekitar mean dalam suatu kumpulan data.
Untuk mengilustrasikannya, pertimbangkan jika kita mengubah nilai terakhir dari kumpulan data sebelumnya dengan angka yang jauh lebih besar:
from scipy. stats import week #define dataset data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ] #calculate standard error of the mean sem(data) 6.978265
Perhatikan bagaimana kesalahan standar meningkat dari 2.001447 menjadi 6.978265 . Hal ini menunjukkan bahwa nilai-nilai pada dataset ini lebih tersebar disekitar mean dibandingkan dengan dataset sebelumnya.
2. Dengan bertambahnya ukuran sampel, kesalahan standar mean cenderung menurun.
Untuk mengilustrasikannya, pertimbangkan kesalahan standar dari mean untuk dua kumpulan data berikut:
from scipy . stats import week #define first dataset and find SEM data1 = [1, 2, 3, 4, 5] sem(data1) 0.7071068 #define second dataset and find SEM data2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5] sem(data2) 0.4714045
Kumpulan data kedua hanyalah kumpulan data pertama yang diulang dua kali. Jadi kedua kumpulan data memiliki mean yang sama tetapi kumpulan data kedua memiliki ukuran sampel yang lebih besar sehingga memiliki kesalahan standar yang lebih kecil.
Sumber daya tambahan
Cara menghitung kesalahan standar mean di R
Cara Menghitung Standard Error Mean di Excel
Cara menghitung standard error mean di Google Sheets