Apa itu sturges? penggaris? (definisi & #038; contoh)


Histogram adalah grafik yang membantu kita memvisualisasikan distribusi nilai dalam sekumpulan data.

Ternyata jumlah kotak yang digunakan dalam histogram bisa berdampak besar pada cara kita menafsirkan data.

Jika kita menggunakan terlalu sedikit kelompok, pola dasar sebenarnya dalam data dapat disembunyikan:

Dan jika kita menggunakan terlalu banyak grup, kita cukup memvisualisasikan gangguan dalam kumpulan data:

Untungnya, kita dapat menggunakan metode yang disebut aturan Sturges untuk menentukan jumlah kotak optimal yang akan digunakan dalam histogram.

Aturan Sturges menggunakan rumus berikut untuk menentukan jumlah grup optimal yang akan digunakan dalam histogram:

Tempat sampah optimal = ⌈log 2 n + 1⌉

Emas:

  • n: jumlah total observasi dalam kumpulan data.
  • ⌈ ⌉ : Simbol yang berarti “langit-langit”, yaitu membulatkan jawaban ke bilangan bulat terdekat.

Contoh: Aturan Sturges

Misalkan kita memiliki kumpulan data berikut dengan total n = 31 observasi:

Kita dapat menggunakan aturan Sturges untuk menentukan jumlah kotak optimal yang digunakan untuk memvisualisasikan nilai-nilai ini dalam histogram:

Tempat sampah optimal = ⌈log 2 (31) + 1⌉ = ⌈4.954 + 1⌉ = ⌈5.954⌉ = 6 .

Menurut aturan Sturges, kita harus menggunakan 6 bin dalam histogram yang kita gunakan untuk memvisualisasikan distribusi nilai ini.

Berikut tampilan histogram dengan 6 grup untuk kumpulan data ini:

Menggunakan Aturan Sturges untuk Menentukan Jumlah Kotak yang Digunakan dalam Histogram

Perhatikan bagaimana ini tampaknya cukup untuk mendapatkan gambaran bagus tentang distribusi nilai yang mendasarinya tanpa terlalu banyak untuk sekadar memvisualisasikan gangguan dalam data.

Nilai-nilai umum untuk aturan Sturges

Tabel berikut menunjukkan jumlah grup optimal untuk digunakan dalam histogram berdasarkan jumlah total observasi dalam kumpulan data, menurut aturan Sturges:

Aturan Sturges untuk ukuran sampel yang berbeda

Alternatif untuk Aturan Sturges

Aturan Sturges adalah metode paling umum untuk menentukan jumlah bin optimal yang akan digunakan dalam histogram, namun ada beberapa metode alternatif, antara lain:

Aturan akar kuadrat : Banyaknya kotak = ⌈√ n

Aturan nasi: Jumlah wadah = ⌈2 * 3n

Aturan Freedman-Diaconis: Banyaknya kotak = (2*IQR) / 3n dimana IQR adalah rentang interkuartil.

Bonus: Kalkulator Aturan Sturges

Gunakan kalkulator online gratis ini untuk secara otomatis menerapkan aturan Sturges guna menentukan jumlah grup optimal yang akan digunakan untuk histogram berdasarkan ukuran kumpulan data.

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *