Cara menghitung rangkuman lima angka di r (dengan contoh)


Ringkasan lima digit adalah cara meringkas sekumpulan data menggunakan lima nilai berikut:

  • Minimum
  • Kuartil pertama
  • median
  • Kuartil ketiga
  • Maksimal

Ringkasan lima angka berguna karena memberikan ringkasan singkat tentang distribusi data sebagai berikut:

  • Ini memberi tahu kita di mana nilai median berada, dengan menggunakan median.
  • Ini memberitahu kita distribusi data, menggunakan kuartil pertama dan ketiga.
  • Ini memberi tahu kita rentang data, menggunakan minimum dan maksimum.

Cara paling sederhana untuk menghitung ringkasan lima angka dari kumpulan data di R adalah dengan menggunakan fungsi fivenum() dari basis R:

 fivenum(data)

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh 1: Ringkasan lima angka dari sebuah vektor

Kode berikut menunjukkan cara menghitung ringkasan lima angka dari vektor numerik di R:

 #define numeric vector
data <- c(4, 6, 6, 7, 8, 9, 12, 13, 14, 15, 15, 18, 22)

#calculate five number summary of data
fivenum(data)

[1] 4 7 12 15 22

Dari hasilnya kita dapat melihat:

  • Minimal: 4
  • Kuartil pertama: 7
  • Median: 12
  • Kuartil ketiga: 15
  • Maksimum: 22

Kita dapat dengan cepat memvisualisasikan ringkasan lima digit dengan membuat plot kotak:

 boxplot(data)

[1] 4 7 12 15 22 

Berikut cara menafsirkan diagram kotak:

  • Garis di bagian bawah grafik mewakili nilai minimum ( 4 ).
  • Garis di bagian bawah kotak melambangkan kuartil pertama ( 7 ).
  • Garis di tengah kotak melambangkan median ( 12 ).
  • Garis di bagian atas kotak mewakili kuartil ketiga ( 15 ).
  • Garis di bagian atas grafik mewakili nilai maksimum ( 22 ).

Contoh 2: Ringkasan lima digit kolom dalam bingkai data

Kode berikut menunjukkan cara menghitung ringkasan lima digit kolom tertentu dalam bingkai data:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(99, 90, 86, 88, 95, 87, 85, 89),
                 assists=c(33, 28, 31, 39, 34, 30, 29, 25),
                 rebounds=c(30, 28, 24, 24, 28, 30, 31, 35))

#calculate five number summary of points column
fivenum(df$points)

[1] 85.0 86.5 88.5 92.5 99.0

Contoh 3: Ringkasan lima digit dari beberapa kolom

Kode berikut menunjukkan cara menggunakan fungsi sapply() untuk menghitung ringkasan lima digit beberapa kolom dalam bingkai data secara bersamaan:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(99, 90, 86, 88, 95, 87, 85, 89),
                 assists=c(33, 28, 31, 39, 34, 30, 29, 25),
                 rebounds=c(30, 28, 24, 24, 28, 30, 31, 35))

#calculate five number summary of points, assists, and rebounds column
sapply(df[c(' points ', ' assists ', ' rebounds ')], fivenum)

     points assists rebounds
[1,] 85.0 25.0 24.0
[2,] 86.5 28.5 26.0
[3,] 88.5 30.5 29.0
[4,] 92.5 33.5 30.5
[5,] 99.0 39.0 35.0

Terkait: Panduan untuk apply(), lapply(), sapply(), dan tapply() di R

Sumber daya tambahan

Cara membuat tabel ringkasan di R
Bagaimana menemukan jangkauan di R
Cara menghilangkan outlier di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *