A: bagaimana cara mengubah jumlah bin di histogram
Saat Anda membuat histogram di R, rumus yang dikenal sebagai aturan Sturges digunakan untuk menentukan jumlah grup optimal yang akan digunakan.
Namun, Anda bisa menggunakan sintaks berikut untuk mengganti rumus ini dan menentukan jumlah pasti grup yang akan digunakan dalam histogram:
hist(data, breaks = seq(min(data), max(data), length. out = 7 ))
Perhatikan bahwa jumlah grup yang digunakan dalam histogram akan kurang satu dari jumlah yang ditentukan dalam argumen length.out .
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh 1: Buat Histogram Dasar
Kode berikut menunjukkan cara membuat histogram dasar di R tanpa menentukan jumlah bin:
#define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)
#create histogram of data
hist(data, col = ' lightblue ')
Dengan menggunakan aturan Sturges, R memutuskan untuk menggunakan total 8 grup dalam histogram.
Contoh 2: Tentukan jumlah bin yang akan digunakan dalam histogram
Kode berikut menunjukkan cara membuat histogram untuk vektor data yang sama dan menggunakan tepat 6 grup:
#define vector of data data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16) #create histogram with 6 bins hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 7 ))
Tindakan Pencegahan dalam Memilih Jumlah Tempat Sampah Tertentu
Jumlah grup yang digunakan dalam histogram mempunyai dampak besar pada cara kita menafsirkan kumpulan data.
Jika kita menggunakan terlalu sedikit grup, pola dasar sebenarnya dalam data dapat disembunyikan:
#define vector of data data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16) #create histogram with 3 bins hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 4 ))
Sebaliknya, jika kita menggunakan terlalu banyak grup, kita cukup memvisualisasikan noise dalam kumpulan data:
#define vector of data data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16) #create histogram with 15 bins hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 16 ))
Secara umum, aturan default Sturges yang digunakan di R cenderung menghasilkan histogram dengan jumlah grup yang optimal.
Jangan ragu untuk menggunakan kode yang disediakan di sini untuk membuat histogram dengan jumlah bin yang tepat, namun berhati-hatilah untuk tidak memilih terlalu banyak atau terlalu sedikit.
Sumber daya tambahan
Tutorial berikut menjelaskan cara menjalankan fungsi umum lainnya dengan histogram di R:
Cara memplot banyak histogram di R
Cara membuat histogram dua variabel di R
Cara membuat histogram frekuensi relatif di R