R'de z puanları nasıl hesaplanır


İstatistikte z-puanı bize bir değerin ortalamadan kaç standart sapma olduğunu gösterir. Z-puanını hesaplamak için aşağıdaki formülü kullanırız:

z = (X – μ) / σ

Altın:

  • X tek bir ham veri değeridir
  • μ nüfus ortalamasıdır
  • σ popülasyon standart sapmasıdır

Bu eğitimde, R’deki ham veri değerleri için z puanlarının nasıl hesaplanacağı açıklanmaktadır.

Örnek 1: Tek Bir Vektör için Z-Skorlarını Bulma

Aşağıdaki kod, bir vektördeki her ham veri değeri için z puanının nasıl bulunacağını gösterir:

 #create vector of data
data <- c(6, 7, 7, 12, 13, 13, 15, 16, 19, 22)

#find z-score for each data value 
z_scores <- (data-mean(data))/sd(data)

#display z-scores
z_scores

[1] -1.3228757 -1.1338934 -1.1338934 -0.1889822 0.0000000 0.0000000
[7] 0.3779645 0.5669467 1.1338934 1.7008401

Her z-puanı bize bireysel bir değerin ortalamadan kaç standart sapma olduğunu söyler. Örneğin:

  • İlk ham veri değeri olan “6” ortalamanın 1.323 standart sapma altındadır .
  • Beşinci ham veri değeri olan “13”, ortalamadan 0 standart sapmadır, yani ortalamaya eşittir.
  • En son ham veri değeri olan “22” ortalamanın 1.701 standart sapma üzerindedir .

Örnek 2: DataFrame’deki Tek Sütun için Z Puanlarını Bulma

Aşağıdaki kod, bir veri çerçevesinin tek bir sütunundaki her ham veri değeri için z puanının nasıl bulunacağını gösterir:

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-score for each data value in the 'points' column
z_scores <- (df$points-mean(df$points))/sd(df$points)

#display z-scores
z_scores

[1] 0.6191904 1.4635409 -1.2383807 -0.9006405 -0.2251601 0.2814502

Her z-puanı bize bireysel bir değerin ortalamadan kaç standart sapma olduğunu söyler. Örneğin:

  • “24”ün ilk ham veri değeri ortalamanın 0,619 standart sapma üzerindedir .
  • İkinci ham veri değeri olan “29” ise ortalamanın 1.464 standart sapma üzerindedir .
  • Üçüncü ham veri değeri olan “13” ise ortalamanın 1.238 standart sapma altındadır .

Ve benzeri.

Örnek 3: Bir DataFrame’deki Her Sütun için Z Puanlarını Bulma

Aşağıdaki kod , sapply() işlevini kullanarak bir veri çerçevesinin her sütunundaki her ham veri değeri için z puanının nasıl bulunacağını gösterir.

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-scores of each column
sapply(df, function(df) (df-mean(df))/sd(df))

         assists points rebounds
[1,] -0.92315712 0.6191904 -0.9035079
[2,] -0.92315712 1.4635409 -0.9035079
[3,] -0.34011052 -1.2383807 -0.4517540
[4,] -0.04858722 -0.9006405 -0.2258770
[5,] 0.53445939 -0.2251601 1.1293849
[6,] 1.70055260 0.2814502 1.3552619

Her bir değere ilişkin z puanları, bulundukları sütuna göre görüntülenir. Örneğin:

  • İlk sütundaki “4”ün ilk değeri, sütununun ortalama değerinin 0,923 standart sapma altındadır .
  • İkinci sütundaki “24”ün ilk değeri, sütununun ortalama değerinin 0,619 standart sapma üzerindedir .
  • Üçüncü sütundaki “9”un ilk değeri, sütununun ortalama değerinden 0,904 standart sapma daha düşüktür .

Ve benzeri.

Daha fazla R eğitimini burada bulabilirsiniz.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir