R'de z puanları nasıl hesaplanır

İle Dr.benjamin anderson Temmuz 28, 2023 Rehber 0 Yorum

İstatistikte z-puanı bize bir değerin ortalamadan kaç standart sapma olduğunu gösterir. Z-puanını hesaplamak için aşağıdaki formülü kullanırız:

z = (X – μ) / σ

Altın:

X tek bir ham veri değeridir
μ nüfus ortalamasıdır
σ popülasyon standart sapmasıdır

Bu eğitimde, R’deki ham veri değerleri için z puanlarının nasıl hesaplanacağı açıklanmaktadır.

Örnek 1: Tek Bir Vektör için Z-Skorlarını Bulma

Aşağıdaki kod, bir vektördeki her ham veri değeri için z puanının nasıl bulunacağını gösterir:

 #create vector of data
data <- c(6, 7, 7, 12, 13, 13, 15, 16, 19, 22)

#find z-score for each data value 
z_scores <- (data-mean(data))/sd(data)

#display z-scores
z_scores

[1] -1.3228757 -1.1338934 -1.1338934 -0.1889822 0.0000000 0.0000000
[7] 0.3779645 0.5669467 1.1338934 1.7008401

Her z-puanı bize bireysel bir değerin ortalamadan kaç standart sapma olduğunu söyler. Örneğin:

İlk ham veri değeri olan “6” ortalamanın 1.323 standart sapma altındadır .
Beşinci ham veri değeri olan “13”, ortalamadan 0 standart sapmadır, yani ortalamaya eşittir.
En son ham veri değeri olan “22” ortalamanın 1.701 standart sapma üzerindedir .

Örnek 2: DataFrame’deki Tek Sütun için Z Puanlarını Bulma

Aşağıdaki kod, bir veri çerçevesinin tek bir sütunundaki her ham veri değeri için z puanının nasıl bulunacağını gösterir:

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-score for each data value in the 'points' column
z_scores <- (df$points-mean(df$points))/sd(df$points)

#display z-scores
z_scores

[1] 0.6191904 1.4635409 -1.2383807 -0.9006405 -0.2251601 0.2814502

Her z-puanı bize bireysel bir değerin ortalamadan kaç standart sapma olduğunu söyler. Örneğin:

“24”ün ilk ham veri değeri ortalamanın 0,619 standart sapma üzerindedir .
İkinci ham veri değeri olan “29” ise ortalamanın 1.464 standart sapma üzerindedir .
Üçüncü ham veri değeri olan “13” ise ortalamanın 1.238 standart sapma altındadır .

Ve benzeri.

Örnek 3: Bir DataFrame’deki Her Sütun için Z Puanlarını Bulma

Aşağıdaki kod , sapply() işlevini kullanarak bir veri çerçevesinin her sütunundaki her ham veri değeri için z puanının nasıl bulunacağını gösterir.

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-scores of each column
sapply(df, function(df) (df-mean(df))/sd(df))

         assists points rebounds
[1,] -0.92315712 0.6191904 -0.9035079
[2,] -0.92315712 1.4635409 -0.9035079
[3,] -0.34011052 -1.2383807 -0.4517540
[4,] -0.04858722 -0.9006405 -0.2258770
[5,] 0.53445939 -0.2251601 1.1293849
[6,] 1.70055260 0.2814502 1.3552619

Her bir değere ilişkin z puanları, bulundukları sütuna göre görüntülenir. Örneğin:

İlk sütundaki “4”ün ilk değeri, sütununun ortalama değerinin 0,923 standart sapma altındadır .
İkinci sütundaki “24”ün ilk değeri, sütununun ortalama değerinin 0,619 standart sapma üzerindedir .
Üçüncü sütundaki “9”un ilk değeri, sütununun ortalama değerinden 0,904 standart sapma daha düşüktür .

Ve benzeri.

Daha fazla R eğitimini burada bulabilirsiniz.

yazar hakkında

Dr.benjamin anderson

Merhaba, ben Benjamin, emekli bir istatistik profesörü ve Statorials öğretmenine dönüştüm. İstatistik alanındaki kapsamlı deneyimim ve uzmanlığımla, öğrencilerimi Statorials aracılığıyla güçlendirmek için bilgilerimi paylaşmaya can atıyorum. Daha fazlasını bil

Örnek 1: Tek Bir Vektör için Z-Skorlarını Bulma

Örnek 2: DataFrame’deki Tek Sütun için Z Puanlarını Bulma

Örnek 3: Bir DataFrame’deki Her Sütun için Z Puanlarını Bulma

yazar hakkında

Dr.benjamin anderson

Yorum ekle