R'de standart sapma nasıl hesaplanır (örneklerle)


R’deki bir vektörün standart sapmasını hesaplamak için aşağıdaki sözdizimini kullanabilirsiniz:

 sd(x)

Bu formülün numune standart sapmasını aşağıdaki formülü kullanarak hesapladığını unutmayın:

Σ (x ben – μ) 2 / (n-1)

Altın:

  • Σ : “Toplam” anlamına gelen süslü bir sembol
  • x i : veri kümesinin i’inci değeri
  • μ : Veri kümesinin ortalama değeri
  • n: Örneklem büyüklüğü

Aşağıdaki örnekler bu fonksiyonun pratikte nasıl kullanılacağını göstermektedir.

Örnek 1: Vektörün standart sapmasını hesaplayın

Aşağıdaki kod, R cinsinden tek bir vektörün standart sapmasının nasıl hesaplanacağını gösterir:

 #create dataset
data <- c(1, 3, 4, 6, 11, 14, 17, 20, 22, 23)

#find standard deviation
sd(data)

[1] 8.279157

Veri kümesinde eksik değerler varsa standart sapmayı hesaplamak için na.rm = TRUE kullanmanız gerektiğini unutmayın:

 #create dataset with missing values
data <- c(1, 3, 4, 6, NA, 14, NA, 20, 22, 23)

#attempt to find standard deviation
sd(data)

[1] NA

#find standard deviation and specify to ignore missing values
sd(data, na. rm = TRUE )

[1] 9.179753

Örnek 2: Veri çerçevesindeki bir sütunun standart sapmasını hesaplama

Aşağıdaki kod, bir veri çerçevesindeki tek bir sütunun standart sapmasının nasıl hesaplanacağını gösterir:

 #create data frame
data <- data. frame (a=c(1, 3, 4, 6, 8, 9),
                   b=c(7, 8, 8, 7, 13, 16),
                   c=c(11, 13, 13, 18, 19, 22),
                   d=c(12, 16, 18, 22, 29, 38))

#find standard deviation of column a
sd(data$a)

[1] 3.060501

Örnek 3: Bir veri çerçevesindeki birden çok sütunun standart sapmasını hesaplama

Aşağıdaki kod, bir veri çerçevesindeki birden çok sütunun standart sapmasının nasıl hesaplanacağını gösterir:

 #create data frame
data <- data. frame (a=c(1, 3, 4, 6, 8, 9),
                   b=c(7, 8, 8, 7, 13, 16),
                   c=c(11, 13, 13, 18, 19, 22),
                   d=c(12, 16, 18, 22, 29, 38))

#find standard deviation of specific columns in data frame
apply(data[, c(' a ', ' c ', ' d ')], 2, sd)

       acd
3.060501 4.289522 9.544632

Ek kaynaklar

R’de aralık nasıl bulunur?
R’de örnek ve popülasyon varyansı nasıl hesaplanır?
R’de aykırı değerler nasıl kaldırılır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir