Keuntungan & kerugian menggunakan median dalam statistik


Median mewakili nilai tengah dari kumpulan data.

Ini dihitung dengan mengurutkan semua observasi dalam kumpulan data dari yang terkecil hingga yang terbesar dan kemudian mengidentifikasi nilai mediannya.

Ada dua keuntungan utama menggunakan median untuk mendeskripsikan pusat kumpulan data:

Keuntungan #1: Median tidak terpengaruh oleh outlier. Karena median hanya menemukan nilai tengah dari kumpulan data, median tidak terpengaruh oleh nilai yang sangat kecil atau sangat besar di kedua ujung kumpulan data.

Keuntungan #2: Median adalah ukuran yang baik untuk pusat kumpulan data yang miring. Ketika kumpulan data dimiringkan ke kiri atau ke kanan , median tetap dapat mengidentifikasi nilai sentral kumpulan data, tidak seperti mean yang sangat dipengaruhi oleh distribusi yang miring.

Namun, penggunaan median untuk meringkas kumpulan data memiliki dua potensi kelemahan:

Kerugian #1: Median tidak menggunakan semua observasi dalam kumpulan data dalam penghitungannya. Dalam statistik, secara umum kita mengatakan bahwa adalah hal yang baik jika kita dapat menggunakan semua observasi dalam kumpulan data, karena dengan demikian kita akan menggunakan semua informasi yang tersedia dari data kita. Namun, median tidak memperhitungkan informasi dari nilai yang sangat kecil atau sangat besar dalam suatu kumpulan data.

Kerugian #2: Median tidak dapat digunakan untuk mencari jumlah semua observasi dalam kumpulan data. Jika kita mengetahui mean dan total ukuran sampel suatu dataset, kita dapat mencari jumlah seluruh nilai dalam dataset tersebut. Namun, kita tidak bisa melakukan hal yang sama dengan median.

Contoh berikut menggambarkan keuntungan dan kerugian dalam praktiknya.

Contoh 1: keuntungan menggunakan median

Misalkan kita mempunyai distribusi gaji yang sangat tidak seimbang dan kita memutuskan untuk menghitung gaji rata-rata dan median:

Rata-rata menunjukkan bahwa rata-rata individu berpenghasilan sekitar $47.000 per tahun, sedangkan median menunjukkan bahwa rata-rata individu hanya berpenghasilan sekitar $32.000 per tahun, yang jauh lebih mewakili rata-rata individu.

Dalam contoh ini, mean dipengaruhi oleh nilai tertinggi di sisi kanan distribusi, sedangkan median tidak.

Atau misalkan kita memiliki distribusi lain yang berisi informasi tentang luas rumah di jalan tertentu dan kita memutuskan untuk menghitung mean dan median dari kumpulan data tersebut:

Kapan menggunakan mean versus median

Rata-ratanya dipengaruhi oleh beberapa rumah yang sangat besar, menyebabkannya mengambil nilai yang jauh lebih tinggi.

Namun, median tidak terpengaruh oleh outlier ini dan oleh karena itu memberikan ukuran yang lebih baik mengenai luas persegi “tipikal” sebuah rumah di jalan tersebut.

Contoh 2: kelemahan menggunakan median

Mari kita ingat potensi kerugian pertama dari median:

Kerugian #1: Median tidak menggunakan semua observasi dalam kumpulan data dalam penghitungannya.

Misalnya, kita memiliki kumpulan data berikut yang menunjukkan distribusi nilai ujian siswa di suatu kelas:

Peringkat: 68, 70, 71, 75, 78, 82, 83 , 83, 85, 90, 91, 91, 92

Nilai median ujian tersebut adalah 83.

Sekarang misalkan kita mempunyai kumpulan data yang sama, namun tiga nilai ujian terendah jauh lebih rendah:

Peringkat: 22, 35, 38, 75, 78, 82, 83 , 83, 85, 90, 91, 91, 92

Nilai median ujian pada distribusi ini masih 83.

Inilah sebabnya kami mengatakan bahwa median tidak menggunakan semua informasi yang tersedia dalam kumpulan data: median tidak memperhitungkan nilai sebenarnya dari data karena hanya mengukur posisi.

Sekarang mari kita ingat potensi kerugian kedua dari median:

Kerugian #2: Median tidak dapat digunakan untuk mencari jumlah semua observasi dalam kumpulan data.

Misalkan kita mempunyai kumpulan data berikut yang berisi informasi tentang total penjualan yang dilakukan oleh 11 karyawan berbeda pada kuartal tertentu:

Penjualan: 12, 12, 15, 19, 22, 24 , 28, 30, 32, 35, 38

Kita tahu nilai mediannya adalah 24 dan kita tahu total karyawannya ada 11 orang. Namun, kami tidak dapat menggunakan informasi ini untuk mengetahui total jumlah penjualan seluruh karyawan.

Sebaliknya, jika kita mengetahui nilai rata-ratanya adalah 24 dan total karyawannya ada 11 orang, kita cukup mengalikan 24 dengan 11 untuk mendapatkan jumlah total penjualannya adalah 24 * 11 = 264.

Catatan : Bergantung pada distribusi data dan masalah yang ingin Anda selesaikan, mean atau median mungkin merupakan metrik pilihan untuk digunakan.

Sumber daya tambahan

Tutorial berikut memberikan informasi tambahan tentang mean dan median dalam statistik:

Bagaimana pengaruh outlier terhadap mean?
Cara memperkirakan mean dan median histogram apa pun
Cara mencari mean dan median petak batang dan daun

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *