Cara menghitung simpangan baku menggunakan dplyr (beserta contoh)

Oleh Benjamin anderson Juli 16, 2023 Memandu 0 Komentar

Anda dapat menggunakan metode berikut untuk menghitung standar deviasi nilai dalam bingkai data di dplyr :

Metode 1: Hitung simpangan baku suatu variabel

 library (dplyr)

df %>%
  summarise(sd_var1 = sd(var1, na. rm = TRUE ))

Metode 2: Hitung simpangan baku beberapa variabel

 library (dplyr)

df %>%
  summarize(sd_var1 = sd(var1, na. rm = TRUE ),
            sd_var2 = sd(var2, na. rm = TRUE ))

Metode 3: menghitung simpangan baku beberapa variabel, dikelompokkan berdasarkan variabel lain

 library (dplyr)

df %>%
  group_by(var3) %>%
  summarize(sd_var1 = sd(var1, na. rm = TRUE ),
            sd_var2 = sd(var2, na. rm = TRUE ))

Tutorial ini menjelaskan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut di R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(12, 15, 18, 22, 14, 17, 29, 35),
                 assists=c(4, 4, 3, 6, 7, 8, 3, 10))

#view data frame
df

  team points assists
1 to 12 4
2 to 15 4
3 To 18 3
4 to 22 6
5 B 14 7
6 B 17 8
7 B 29 3
8 B 35 10

Contoh 1: Hitung simpangan baku suatu variabel

Kode berikut menunjukkan cara menghitung simpangan baku variabel poin :

 library (dplyr)

#calculate standard deviation of points variable
df %>%
  summarise(sd_points = sd(points, na. rm = TRUE ))

  sd_points
1 7.995534

Dari hasilnya terlihat bahwa standar deviasi nilai variabel poin adalah 7.995534 .

Contoh 2: Hitung simpangan baku beberapa variabel

Kode berikut menunjukkan cara menghitung standar deviasi poin dan variabel pembantu :

 library (dplyr)

#calculate standard deviation of points and assists variables
df %>%
  summarise(sd_points = sd(points, na. rm = TRUE ),
            sd_assists = sd(assists, na. rm = TRUE ))

  sd_points sd_assists
1 7.995534 2.559994

Outputnya menampilkan deviasi standar untuk poin dan variabel bantuan .

Contoh 3: menghitung simpangan baku beberapa variabel yang dikelompokkan berdasarkan variabel lain

Kode berikut menunjukkan cara menghitung standar deviasi poin dan variabel pembantu :

 library (dplyr)

#calculate standard deviation of points and assists variables
df %>%
  group_by(team) %>%
  summarise(sd_points = sd(points, na. rm = TRUE ),
            sd_assists = sd(assists, na. rm = TRUE ))

# A tibble: 2 x 3
  team sd_points sd_assists
             
1 A 4.27 1.26
2B 9.91 2.94

Hasilnya menampilkan standar deviasi untuk poin dan variabel bantuan untuk Tim A dan Tim B.

Catatan : Anda dapat menyertakan daftar beberapa variabel dalam fungsi group_by() jika Anda ingin mengelompokkan berdasarkan beberapa variabel.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara memfilter nilai unik menggunakan dplyr
Cara memfilter berdasarkan beberapa kondisi menggunakan dplyr
Cara menghitung jumlah kemunculan pada kolom di R

Tentang Penulis

Benjamin anderson

Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya