R cinsinden ortalamanın standart hatası nasıl hesaplanır?
Ortalamanın standart hatası, bir veri kümesindeki değerlerin dağılımını ölçmenin bir yoludur. Aşağıdaki şekilde hesaplanır:
Standart hata = s / √n
Altın:
- s : numune standart sapması
- n : örneklem büyüklüğü
Bu eğitimde, R’deki bir veri kümesinin standart hatasını hesaplamak için kullanabileceğiniz iki yöntem açıklanmaktadır.
Yöntem 1: Plotrix kitaplığını kullanma
Ortalamanın standart hatasını hesaplamanın ilk yolu Plotrix kütüphanesinin yerleşik std.error() fonksiyonunu kullanmaktır.
Aşağıdaki kod bu işlevin nasıl kullanılacağını gösterir:
library (plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
Ortalamanın standart hatası 2,001447 olarak çıkıyor.
Yöntem 2: Kendi işlevinizi tanımlayın
Bir veri kümesinin ortalamasının standart hatasını hesaplamanın başka bir yolu da kendi fonksiyonunuzu tanımlamaktır.
Aşağıdaki kod bunun nasıl yapılacağını gösterir:
#define standard error of mean function std.error <- function (x) sd(x)/sqrt( length (x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
Yine ortalamanın standart hatası 2,0014 olarak çıkıyor.
Ortalamanın standart hatası nasıl yorumlanır?
Ortalamanın standart hatası basitçe değerlerin ortalama etrafındaki yayılımının bir ölçüsüdür.
Ortalamanın standart hatasını yorumlarken akılda tutulması gereken iki şey vardır:
1. Ortalamanın standart hatası ne kadar büyük olursa, bir veri setinde değerler ortalamanın etrafında o kadar dağınık olur.
Bunu göstermek için, önceki veri kümesinin son değerini çok daha büyük bir sayıyla değiştirip değiştirmediğimizi düşünün:
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
Standart hatanın 2,001447’den 6,978265’e nasıl yükseldiğine dikkat edin.
Bu durum, bu veri setindeki değerlerin önceki veri setine göre ortalama etrafında daha fazla dağıldığını göstermektedir.
2. Örneklem büyüklüğü arttıkça ortalamanın standart hatası azalma eğilimindedir.
Bunu göstermek için aşağıdaki iki veri kümesinin ortalamanın standart hatasını düşünün:
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
İkinci veri seti basitçe iki kez tekrarlanan ilk veri setidir.
Yani her iki veri seti de aynı ortalamaya sahiptir ancak ikinci veri seti daha büyük bir örneklem boyutuna sahiptir ve dolayısıyla standart hatası daha küçüktür.
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
R’de örnek ve popülasyon varyansı nasıl hesaplanır?
R’de havuzlanmış varyans nasıl hesaplanır
R’nin varyasyon katsayısı nasıl hesaplanır?