Kapan menggunakan mean vs. median: dengan contoh


Rata-rata suatu kumpulan data mewakili nilai rata-rata kumpulan data tersebut. Ini dihitung sebagai berikut:

Rata-rata = Σx i / n

Emas:

  • Σ: Simbol yang berarti “jumlah”
  • x i : Pengamatan ke- i dalam suatu kumpulan data
  • n: jumlah total observasi dalam kumpulan data

Median mewakili nilai tengah dari kumpulan data. Ini dihitung dengan mengurutkan semua observasi dalam kumpulan data dari yang terkecil hingga yang terbesar dan kemudian mengidentifikasi nilai mediannya.

Misalnya, kita memiliki kumpulan data berikut dengan 11 observasi :

Kumpulan data: 3, 4, 4, 6, 7, 8, 12, 13, 15, 16, 17

Rata-rata kumpulan data dihitung sebagai berikut:

Rata-rata = (3+4+4+6+7+8+12+13+15+16+17) / 11 = 9,54

Median dari dataset adalah nilai yang berada tepat di tengah, yaitu 8:

3, 4, 4, 6, 7 , 8, 12, 13, 15, 16, 17

Perkiraan rata-rata dan median lokasi pusat kumpulan data. Namun, bergantung pada sifat datanya, mean atau median mungkin lebih berguna dalam menggambarkan pusat kumpulan data.

Kapan menggunakan rata-rata

Cara terbaik adalah menggunakan mean untuk mendeskripsikan pusat kumpulan data ketika distribusi pada dasarnya simetris dan tidak ada outlier.

Misalnya, kita mempunyai distribusi berikut yang menunjukkan gaji penduduk suatu kota tertentu:

Karena distribusi ini cukup simetris (jika Anda membaginya di tengah-tengah, masing-masing setengahnya akan terlihat kira-kira sama) dan tidak ada outlier, kita dapat menggunakan mean untuk mendeskripsikan pusat kumpulan data ini.

Rata-ratanya adalah $63.000, yang kira-kira berada di tengah distribusi:

Kapan menggunakan median

Cara terbaik adalah menggunakan median ketika distribusinya miring atau ketika ada outlier.

Data terdistorsi:

Ketika suatu distribusi miring, median menggambarkan pusat distribusi lebih baik daripada mean.

Misalnya saja distribusi gaji penduduk suatu kota berikut ini:

Median lebih mencerminkan gaji “tipikal” penduduk dibandingkan rata-rata. Hal ini karena nilai yang tinggi pada bagian ekor distribusi cenderung mendorong mean menjauhi pusat dan menuju ekor panjang.

Dalam contoh ini, rata-rata menunjukkan bahwa rata-rata individu berpenghasilan sekitar $47.000 per tahun, sedangkan median menunjukkan bahwa rata-rata individu hanya berpenghasilan sekitar $32.000 per tahun, yang lebih mewakili rata-rata individu.

Pencilan:

Median juga membantu menangkap lokasi pusat suatu distribusi dengan lebih baik ketika terdapat outlier dalam data. Misalnya, perhatikan grafik berikut yang menunjukkan luas persegi rumah di jalan tertentu:

Kapan menggunakan mean versus median

Rata-rata sangat dipengaruhi oleh beberapa rumah yang sangat besar, sedangkan median tidak. Oleh karena itu, median berfungsi lebih baik dalam menangkap ukuran luas “tipikal” sebuah rumah di jalan tersebut dibandingkan rata-rata.

Ringkasan

Kesimpulan:

  • Mean dan median dapat digunakan untuk menggambarkan di mana “pusat” suatu kumpulan data.
  • Rata-rata paling baik digunakan ketika distribusi nilai data simetris dan tidak ada outlier yang jelas.
  • Cara terbaik adalah menggunakan median ketika distribusi nilai data menyimpang atau ketika terdapat outlier yang jelas.

Sumber daya tambahan

Bagaimana pengaruh outlier terhadap mean?
Cara memperkirakan mean dan median histogram apa pun
Cara mencari mean dan median petak batang dan daun

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *