Cara menghitung kesalahan standar mean di r
Kesalahan standar mean adalah cara mengukur sebaran nilai dalam suatu kumpulan data. Ini dihitung sebagai berikut:
Kesalahan standar = s / √n
Emas:
- s : deviasi standar sampel
- n : ukuran sampel
Tutorial ini menjelaskan dua metode yang dapat Anda gunakan untuk menghitung kesalahan standar kumpulan data di R.
Metode 1: Gunakan perpustakaan Plotrix
Cara pertama untuk menghitung kesalahan standar rata-rata adalah dengan menggunakan fungsi std.error() bawaan perpustakaan Plotrix.
Kode berikut menunjukkan cara menggunakan fungsi ini:
library (plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
Kesalahan standar rata-ratanya adalah 2.001447 .
Metode 2: Tentukan fungsi Anda sendiri
Cara lain untuk menghitung kesalahan standar rata-rata kumpulan data adalah dengan mendefinisikan fungsi Anda sendiri.
Kode berikut menunjukkan cara melakukan ini:
#define standard error of mean function std.error <- function (x) sd(x)/sqrt( length (x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
Sekali lagi, kesalahan standar rata-ratanya adalah 2.0014 .
Bagaimana menafsirkan kesalahan standar dari mean
Kesalahan standar mean hanyalah ukuran penyebaran nilai di sekitar mean.
Ada dua hal yang perlu diingat ketika menafsirkan kesalahan standar mean:
1. Semakin besar kesalahan standar mean, maka nilai-nilai tersebut semakin tersebar di sekitar mean dalam suatu kumpulan data.
Untuk mengilustrasikannya, pertimbangkan jika kita mengubah nilai terakhir dari kumpulan data sebelumnya dengan angka yang jauh lebih besar:
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
Perhatikan bagaimana kesalahan standar meningkat dari 2.001447 menjadi 6.978265 .
Hal ini menunjukkan bahwa nilai-nilai pada dataset ini lebih tersebar disekitar mean dibandingkan dengan dataset sebelumnya.
2. Dengan bertambahnya ukuran sampel, kesalahan standar mean cenderung menurun.
Untuk mengilustrasikannya, pertimbangkan kesalahan standar dari mean untuk dua kumpulan data berikut:
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
Kumpulan data kedua hanyalah kumpulan data pertama yang diulang dua kali.
Jadi kedua kumpulan data memiliki mean yang sama tetapi kumpulan data kedua memiliki ukuran sampel yang lebih besar sehingga memiliki kesalahan standar yang lebih kecil.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:
Cara menghitung varians sampel dan populasi di R
Cara menghitung varians gabungan di R
Cara menghitung koefisien variasi R