Bagaimana membandingkan histogram (dengan contoh)


Histogram adalah jenis bagan yang memungkinkan kita memvisualisasikan distribusi nilai dalam sekumpulan data.

Sumbu X menunjukkan nilai kumpulan data dan sumbu Y menunjukkan frekuensi setiap nilai.

Histogram berguna karena memungkinkan kita memahami dengan cepat distribusi nilai dalam kumpulan data. Mereka juga berguna untuk membandingkan dua kumpulan data yang berbeda.

Saat membandingkan dua atau lebih histogram, kita dapat menjawab tiga pertanyaan berbeda:

1. Bagaimana perbandingan nilai mediannya?

Kita dapat memperkirakan secara kasar bahwa median terletak di dekat bagian tengah setiap histogram, sehingga memungkinkan kita membandingkan nilai median dari distribusi.

2. Bagaimana perbandingan dispersi?

Kita dapat melihat secara visual histogram mana yang lebih tersebar, yang memberi kita gambaran distribusi mana yang memiliki nilai lebih tersebar.

3. Bagaimana perbandingan asimetri?

Jika histogram mempunyai “ekor” di sisi kiri plot, maka dikatakan miring negatif. Sebaliknya, jika histogram mempunyai “ekor” di sisi kanan plot, maka dikatakan miring positif. Kita dapat memeriksa setiap histogram secara visual untuk membandingkan kemiringannya .

Contoh berikut menunjukkan cara membandingkan dua histogram berbeda dan menjawab ketiga pertanyaan tersebut.

Contoh: membandingkan histogram

Diasumsikan 200 siswa menggunakan satu metode belajar untuk mempersiapkan ujian dan 200 siswa lainnya menggunakan metode belajar berbeda untuk mempersiapkan ujian yang sama.

Misalkan kita membuat histogram berikut untuk membandingkan hasil ujian setiap kelompok siswa:

Kita dapat membandingkan histogram ini dan menjawab tiga pertanyaan berikut:

1. Bagaimana perbandingan nilai mediannya?

Meskipun kita tidak mengetahui secara pasti nilai median dari setiap distribusi hanya dengan melihat histogramnya, namun terlihat jelas bahwa median nilai ujian siswa yang menggunakan Metode 1 lebih tinggi daripada median nilai ujian siswa yang menggunakan Metode 1. digunakan. metode 2.

Kita dapat memperkirakan nilai median untuk metode 1 adalah sekitar 84 dan nilai median untuk metode 2 adalah sekitar 78.

2. Bagaimana perbandingan dispersi?

Nilai histogram untuk Metode 2 jauh lebih tersebar dibandingkan dengan Metode 1, yang menunjukkan bahwa terdapat dispersi yang jauh lebih besar dalam hasil ujian bagi siswa yang menggunakan Metode 2.

3. Bagaimana perbandingan asimetri?

Dilihat dari histogramnya, terlihat sebaran nilai tes Metode 1 agak condong ke kanan, seperti yang ditunjukkan dengan “ekor” yang memanjang ke kanan histogram.

Namun, tampaknya tidak ada “ekor” dalam distribusi hasil ujian untuk metode 2, yang menunjukkan bahwa distribusinya sedikit atau tidak miring.

Bonus : Berikut kode yang kita gunakan di R untuk membuat dua histogram ini:

 library (ggplot2)

#make this example reproducible
set. seeds (0)

#create data frame
df <- data. frame (method=rep(c(' Method 1 ', ' Method 2 '), each= 200 ),
                 Score=c(rnorm( 200 , mean= 84 , sd= 2 ),
                         rnorm( 200 , mean= 78 , sd= 4 )))

#create histogram of scores for each method
ggplot(df, aes(x=Score)) +
  geom_histogram(fill=' steelblue ', color=' black ') +
  facet_wrap(.~method, nrow= 2 ) +
  labs(title=' Exam Scores by Study Method ')

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya dengan histogram:

Cara memperkirakan mean dan median histogram apa pun
Cara memperkirakan deviasi standar histogram apa pun
Bagaimana menggambarkan bentuk histogram

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *