R'de z puanları nasıl hesaplanır
İstatistikte z-puanı bize bir değerin ortalamadan kaç standart sapma olduğunu gösterir. Z-puanını hesaplamak için aşağıdaki formülü kullanırız:
z = (X – μ) / σ
Altın:
- X tek bir ham veri değeridir
- μ nüfus ortalamasıdır
- σ popülasyon standart sapmasıdır
Bu eğitimde, R’deki ham veri değerleri için z puanlarının nasıl hesaplanacağı açıklanmaktadır.
Örnek 1: Tek Bir Vektör için Z-Skorlarını Bulma
Aşağıdaki kod, bir vektördeki her ham veri değeri için z puanının nasıl bulunacağını gösterir:
#create vector of data data <- c(6, 7, 7, 12, 13, 13, 15, 16, 19, 22) #find z-score for each data value z_scores <- (data-mean(data))/sd(data) #display z-scores z_scores [1] -1.3228757 -1.1338934 -1.1338934 -0.1889822 0.0000000 0.0000000 [7] 0.3779645 0.5669467 1.1338934 1.7008401
Her z-puanı bize bireysel bir değerin ortalamadan kaç standart sapma olduğunu söyler. Örneğin:
- İlk ham veri değeri olan “6” ortalamanın 1.323 standart sapma altındadır .
- Beşinci ham veri değeri olan “13”, ortalamadan 0 standart sapmadır, yani ortalamaya eşittir.
- En son ham veri değeri olan “22” ortalamanın 1.701 standart sapma üzerindedir .
Örnek 2: DataFrame’deki Tek Sütun için Z Puanlarını Bulma
Aşağıdaki kod, bir veri çerçevesinin tek bir sütunundaki her ham veri değeri için z puanının nasıl bulunacağını gösterir:
#create dataframe df <- data.frame(assists = c(4, 4, 6, 7, 9, 13), points = c(24, 29, 13, 15, 19, 22), rebounds = c(5, 5, 7, 8, 14, 15)) #find z-score for each data value in the 'points' column z_scores <- (df$points-mean(df$points))/sd(df$points) #display z-scores z_scores [1] 0.6191904 1.4635409 -1.2383807 -0.9006405 -0.2251601 0.2814502
Her z-puanı bize bireysel bir değerin ortalamadan kaç standart sapma olduğunu söyler. Örneğin:
- “24”ün ilk ham veri değeri ortalamanın 0,619 standart sapma üzerindedir .
- İkinci ham veri değeri olan “29” ise ortalamanın 1.464 standart sapma üzerindedir .
- Üçüncü ham veri değeri olan “13” ise ortalamanın 1.238 standart sapma altındadır .
Ve benzeri.
Örnek 3: Bir DataFrame’deki Her Sütun için Z Puanlarını Bulma
Aşağıdaki kod , sapply() işlevini kullanarak bir veri çerçevesinin her sütunundaki her ham veri değeri için z puanının nasıl bulunacağını gösterir.
#create dataframe df <- data.frame(assists = c(4, 4, 6, 7, 9, 13), points = c(24, 29, 13, 15, 19, 22), rebounds = c(5, 5, 7, 8, 14, 15)) #find z-scores of each column sapply(df, function(df) (df-mean(df))/sd(df)) assists points rebounds [1,] -0.92315712 0.6191904 -0.9035079 [2,] -0.92315712 1.4635409 -0.9035079 [3,] -0.34011052 -1.2383807 -0.4517540 [4,] -0.04858722 -0.9006405 -0.2258770 [5,] 0.53445939 -0.2251601 1.1293849 [6,] 1.70055260 0.2814502 1.3552619
Her bir değere ilişkin z puanları, bulundukları sütuna göre görüntülenir. Örneğin:
- İlk sütundaki “4”ün ilk değeri, sütununun ortalama değerinin 0,923 standart sapma altındadır .
- İkinci sütundaki “24”ün ilk değeri, sütununun ortalama değerinin 0,619 standart sapma üzerindedir .
- Üçüncü sütundaki “9”un ilk değeri, sütununun ortalama değerinden 0,904 standart sapma daha düşüktür .
Ve benzeri.
Daha fazla R eğitimini burada bulabilirsiniz.