Cara menghitung kesalahan standar mean di r


Kesalahan standar mean adalah cara mengukur sebaran nilai dalam suatu kumpulan data. Ini dihitung sebagai berikut:

Kesalahan standar = s / √n

Emas:

  • s : deviasi standar sampel
  • n : ukuran sampel

Tutorial ini menjelaskan dua metode yang dapat Anda gunakan untuk menghitung kesalahan standar kumpulan data di R.

Metode 1: Gunakan perpustakaan Plotrix

Cara pertama untuk menghitung kesalahan standar rata-rata adalah dengan menggunakan fungsi std.error() bawaan perpustakaan Plotrix.

Kode berikut menunjukkan cara menggunakan fungsi ini:

 library (plotrix)

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

Kesalahan standar rata-ratanya adalah 2.001447 .

Metode 2: Tentukan fungsi Anda sendiri

Cara lain untuk menghitung kesalahan standar rata-rata kumpulan data adalah dengan mendefinisikan fungsi Anda sendiri.

Kode berikut menunjukkan cara melakukan ini:

 #define standard error of mean function
std.error <- function (x) sd(x)/sqrt( length (x))

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

Sekali lagi, kesalahan standar rata-ratanya adalah 2.0014 .

Bagaimana menafsirkan kesalahan standar dari mean

Kesalahan standar mean hanyalah ukuran penyebaran nilai di sekitar mean.

Ada dua hal yang perlu diingat ketika menafsirkan kesalahan standar mean:

1. Semakin besar kesalahan standar mean, maka nilai-nilai tersebut semakin tersebar di sekitar mean dalam suatu kumpulan data.

Untuk mengilustrasikannya, pertimbangkan jika kita mengubah nilai terakhir dari kumpulan data sebelumnya dengan angka yang jauh lebih besar:

 #define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150)

#calculate standard error of the mean 
std.error(data)

6.978265

Perhatikan bagaimana kesalahan standar meningkat dari 2.001447 menjadi 6.978265 .

Hal ini menunjukkan bahwa nilai-nilai pada dataset ini lebih tersebar disekitar mean dibandingkan dengan dataset sebelumnya.

2. Dengan bertambahnya ukuran sampel, kesalahan standar mean cenderung menurun.

Untuk mengilustrasikannya, pertimbangkan kesalahan standar dari mean untuk dua kumpulan data berikut:

 #define first dataset and find SEM
data1 <- c(1, 2, 3, 4, 5)
std.error(data1)

0.7071068

#define second dataset and find SEM
data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5)
std.error(data2)

0.4714045

Kumpulan data kedua hanyalah kumpulan data pertama yang diulang dua kali.

Jadi kedua kumpulan data memiliki mean yang sama tetapi kumpulan data kedua memiliki ukuran sampel yang lebih besar sehingga memiliki kesalahan standar yang lebih kecil.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara menghitung varians sampel dan populasi di R
Cara menghitung varians gabungan di R
Cara menghitung koefisien variasi R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *