Cara menghitung skor z di r


Dalam statistik, skor-z memberi tahu kita berapa banyak standar deviasi suatu nilai dari mean. Kami menggunakan rumus berikut untuk menghitung skor-z:

z = (X – μ) / σ

Emas:

  • X adalah nilai data mentah tunggal
  • μ adalah rata-rata populasi
  • σ adalah simpangan baku populasi

Tutorial ini menjelaskan cara menghitung skor-z untuk nilai data mentah di R.

Contoh 1: Menemukan Skor Z untuk Vektor Tunggal

Kode berikut menunjukkan cara mencari skor-z untuk setiap nilai data mentah dalam vektor:

 #create vector of data
data <- c(6, 7, 7, 12, 13, 13, 15, 16, 19, 22)

#find z-score for each data value 
z_scores <- (data-mean(data))/sd(data)

#display z-scores
z_scores

[1] -1.3228757 -1.1338934 -1.1338934 -0.1889822 0.0000000 0.0000000
[7] 0.3779645 0.5669467 1.1338934 1.7008401

Setiap skor-z memberi tahu kita berapa banyak deviasi standar suatu nilai individu dari mean. Misalnya:

  • Nilai data mentah pertama “6” adalah 1,323 standar deviasi di bawah rata-rata.
  • Nilai data mentah kelima, “13”, adalah 0 standar deviasi dari mean, yaitu sama dengan mean.
  • Nilai data mentah terbaru “22” adalah 1,701 standar deviasi di atas rata-rata.

Contoh 2: Temukan Z-Score untuk Satu Kolom di DataFrame

Kode berikut menunjukkan cara menemukan skor-z untuk setiap nilai data mentah dalam satu kolom kerangka data:

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-score for each data value in the 'points' column
z_scores <- (df$points-mean(df$points))/sd(df$points)

#display z-scores
z_scores

[1] 0.6191904 1.4635409 -1.2383807 -0.9006405 -0.2251601 0.2814502

Setiap skor-z memberi tahu kita berapa banyak deviasi standar suatu nilai individu dari mean. Misalnya:

  • Nilai data mentah pertama “24” adalah 0,619 standar deviasi di atas rata-rata.
  • Nilai data mentah kedua, “29”, adalah 1,464 standar deviasi di atas rata-rata.
  • Nilai data mentah ketiga, “13”, adalah 1,238 standar deviasi di bawah rata-rata.

Dan seterusnya.

Contoh 3: Temukan Z-Score untuk Setiap Kolom di DataFrame

Kode berikut menunjukkan cara menemukan skor-z untuk setiap nilai data mentah di setiap kolom bingkai data menggunakan fungsi sapply() .

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-scores of each column
sapply(df, function(df) (df-mean(df))/sd(df))

         assists points rebounds
[1,] -0.92315712 0.6191904 -0.9035079
[2,] -0.92315712 1.4635409 -0.9035079
[3,] -0.34011052 -1.2383807 -0.4517540
[4,] -0.04858722 -0.9006405 -0.2258770
[5,] 0.53445939 -0.2251601 1.1293849
[6,] 1.70055260 0.2814502 1.3552619

Skor-z untuk setiap nilai individual ditampilkan relatif terhadap kolom tempatnya berada. Misalnya:

  • Nilai pertama “4” pada kolom pertama adalah 0,923 standar deviasi di bawah nilai rata-rata kolomnya.
  • Nilai pertama “24” pada kolom kedua adalah 0,619 standar deviasi di atas nilai rata-rata kolomnya.
  • Nilai pertama “9” pada kolom ketiga adalah 0,904 standar deviasi lebih rendah dari nilai rata-rata kolomnya.

Dan seterusnya.

Anda dapat menemukan lebih banyak tutorial R di sini .

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *