R cinsinden ortalamanın standart hatası nasıl hesaplanır?


Ortalamanın standart hatası, bir veri kümesindeki değerlerin dağılımını ölçmenin bir yoludur. Aşağıdaki şekilde hesaplanır:

Standart hata = s / √n

Altın:

  • s : numune standart sapması
  • n : örneklem büyüklüğü

Bu eğitimde, R’deki bir veri kümesinin standart hatasını hesaplamak için kullanabileceğiniz iki yöntem açıklanmaktadır.

Yöntem 1: Plotrix kitaplığını kullanma

Ortalamanın standart hatasını hesaplamanın ilk yolu Plotrix kütüphanesinin yerleşik std.error() fonksiyonunu kullanmaktır.

Aşağıdaki kod bu işlevin nasıl kullanılacağını gösterir:

 library (plotrix)

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

Ortalamanın standart hatası 2,001447 olarak çıkıyor.

Yöntem 2: Kendi işlevinizi tanımlayın

Bir veri kümesinin ortalamasının standart hatasını hesaplamanın başka bir yolu da kendi fonksiyonunuzu tanımlamaktır.

Aşağıdaki kod bunun nasıl yapılacağını gösterir:

 #define standard error of mean function
std.error <- function (x) sd(x)/sqrt( length (x))

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

Yine ortalamanın standart hatası 2,0014 olarak çıkıyor.

Ortalamanın standart hatası nasıl yorumlanır?

Ortalamanın standart hatası basitçe değerlerin ortalama etrafındaki yayılımının bir ölçüsüdür.

Ortalamanın standart hatasını yorumlarken akılda tutulması gereken iki şey vardır:

1. Ortalamanın standart hatası ne kadar büyük olursa, bir veri setinde değerler ortalamanın etrafında o kadar dağınık olur.

Bunu göstermek için, önceki veri kümesinin son değerini çok daha büyük bir sayıyla değiştirip değiştirmediğimizi düşünün:

 #define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150)

#calculate standard error of the mean 
std.error(data)

6.978265

Standart hatanın 2,001447’den 6,978265’e nasıl yükseldiğine dikkat edin.

Bu durum, bu veri setindeki değerlerin önceki veri setine göre ortalama etrafında daha fazla dağıldığını göstermektedir.

2. Örneklem büyüklüğü arttıkça ortalamanın standart hatası azalma eğilimindedir.

Bunu göstermek için aşağıdaki iki veri kümesinin ortalamanın standart hatasını düşünün:

 #define first dataset and find SEM
data1 <- c(1, 2, 3, 4, 5)
std.error(data1)

0.7071068

#define second dataset and find SEM
data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5)
std.error(data2)

0.4714045

İkinci veri seti basitçe iki kez tekrarlanan ilk veri setidir.

Yani her iki veri seti de aynı ortalamaya sahiptir ancak ikinci veri seti daha büyük bir örneklem boyutuna sahiptir ve dolayısıyla standart hatası daha küçüktür.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’de örnek ve popülasyon varyansı nasıl hesaplanır?
R’de havuzlanmış varyans nasıl hesaplanır
R’nin varyasyon katsayısı nasıl hesaplanır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir