Plot titik dan histogram: apa bedanya?


Dua plot yang umum digunakan untuk memvisualisasikan distribusi nilai dalam suatu kumpulan data adalah plot titik dan histogram .

Plot titik menampilkan nilai data individual di sepanjang sumbu x dan menggunakan titik untuk mewakili frekuensi setiap nilai individual.

Histogram menampilkan rentang data sepanjang sumbu x dan menggunakan batang persegi panjang untuk mewakili frekuensi nilai yang dimiliki setiap rentang.

Contoh berikut menunjukkan cara membuat plot titik dan histogram untuk kumpulan data yang sama.

Contoh: Membuat Dot Plot dan Histogram untuk Kumpulan Data yang Sama

Misalkan kita memiliki kumpulan data berikut dengan 18 nilai:

Data: 1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10

Berikut tampilan plot titik untuk kumpulan data ini:

Sumbu x menunjukkan nilai data individual dan sumbu y menunjukkan frekuensi setiap nilai.

Misalnya kita melihat nilai “2” muncul tiga kali pada dataset karena ada tiga titik di atasnya. Demikian pula kita dapat melihat bahwa nilai “3” hanya muncul satu kali karena hanya ada satu titik di atasnya.

Dan seperti inilah tampilan histogram untuk kumpulan data ini:

Yang rapi.

Misalnya kita melihat tujuh nilai berada di antara 0 dan 2, dua nilai berada di antara 2 dan 4, dan seterusnya.

Bonus : Bagi yang penasaran, kami menggunakan kode R berikut untuk membuat dot plot dan histogram seperti di atas:

 #define dataset
data <- c(1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10)

#create dot plot
stripchart(data, method = "stack", offset = .5, at = 0, pch = 19, cex=5,
           col = "steelblue", main = "Dot Plot",
           xlab = "Data Values", ylab="Frequency")

#create histogram
hist(data, col='steelblue', main='Histogram', xlab='Data Values')

Plot Titik atau Histogram: Mana yang Harus Anda Gunakan?

Seperti disebutkan sebelumnya, plot titik dan histogram dapat digunakan untuk memvisualisasikan distribusi nilai dalam kumpulan data.

Sebagai aturan praktis, kita biasanya menggunakan plot titik ketika kumpulan data kita kecil karena memungkinkan kita melihat dengan tepat berapa kali setiap nilai muncul.

Sebaliknya, kita biasanya menggunakan histogram ketika kumpulan data kita besar karena membuat titik untuk mewakili setiap nilai individual dalam kumpulan data yang besar itu membosankan.

Perlu diingat bahwa satu-satunya kelemahan menggunakan histogram adalah kita tidak dapat mengetahui secara pasti berapa kali setiap nilai muncul.

Misalnya pada histogram sebelumnya kita melihat ada tujuh nilai yang berada di antara 0 dan 2, namun kita tidak mengetahui secara pasti berapa nilai yang 1 dan berapa nilai yang 2.

Jika kita hanya ingin memahami “bentuk” umum suatu distribusi, maka secara umum tidak masalah jika kita tidak mengetahui nilai individual dari suatu kumpulan data.

Perlu diingat juga bahwa kita tidak dapat menghitung median atau rata-rata secara tepat hanya dengan melihat histogram, karena kita tidak mengetahui nilai individualnya.

Sumber daya tambahan

Tutorial berikut memberikan informasi tambahan tentang histogram:

Cara memperkirakan histogram mean dan median
Bagaimana menggambarkan bentuk histogram
Cara membuat histogram di R
Cara Membuat Histogram dengan Python

Tutorial berikut memberikan informasi tambahan tentang plot titik:

Cara mencari pusat dan penyebaran suatu titik plot
Cara Membuat Plot Titik di Google Spreadsheet
Cara Membuat Plot Titik di Excel
Cara Membuat Plot Titik di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *