A: bagaimana cara mengubah jumlah bin di histogram


Saat Anda membuat histogram di R, rumus yang dikenal sebagai aturan Sturges digunakan untuk menentukan jumlah grup optimal yang akan digunakan.

Namun, Anda bisa menggunakan sintaks berikut untuk mengganti rumus ini dan menentukan jumlah pasti grup yang akan digunakan dalam histogram:

 hist(data, breaks = seq(min(data), max(data), length. out = 7 ))

Perhatikan bahwa jumlah grup yang digunakan dalam histogram akan kurang satu dari jumlah yang ditentukan dalam argumen length.out .

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh 1: Buat Histogram Dasar

Kode berikut menunjukkan cara membuat histogram dasar di R tanpa menentukan jumlah bin:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram of data
hist(data, col = ' lightblue ') 

Dengan menggunakan aturan Sturges, R memutuskan untuk menggunakan total 8 grup dalam histogram.

Contoh 2: Tentukan jumlah bin yang akan digunakan dalam histogram

Kode berikut menunjukkan cara membuat histogram untuk vektor data yang sama dan menggunakan tepat 6 grup:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 6 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 7 )) 

Tindakan Pencegahan dalam Memilih Jumlah Tempat Sampah Tertentu

Jumlah grup yang digunakan dalam histogram mempunyai dampak besar pada cara kita menafsirkan kumpulan data.

Jika kita menggunakan terlalu sedikit grup, pola dasar sebenarnya dalam data dapat disembunyikan:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 3 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 4 )) 

Sebaliknya, jika kita menggunakan terlalu banyak grup, kita cukup memvisualisasikan noise dalam kumpulan data:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 15 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 16 )) 

Secara umum, aturan default Sturges yang digunakan di R cenderung menghasilkan histogram dengan jumlah grup yang optimal.

Jangan ragu untuk menggunakan kode yang disediakan di sini untuk membuat histogram dengan jumlah bin yang tepat, namun berhati-hatilah untuk tidak memilih terlalu banyak atau terlalu sedikit.

Sumber daya tambahan

Tutorial berikut menjelaskan cara menjalankan fungsi umum lainnya dengan histogram di R:

Cara memplot banyak histogram di R
Cara membuat histogram dua variabel di R
Cara membuat histogram frekuensi relatif di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *