Keuntungan & kerugian menggunakan rata-rata dalam statistik
Rata-rata suatu kumpulan data mewakili nilai rata-rata kumpulan data tersebut.
Ini dihitung sebagai berikut:
Rata-rata = Σx i / n
Emas:
- Σ: Simbol yang berarti “jumlah”
- x i : Pengamatan ke- i dalam suatu kumpulan data
- n: jumlah total observasi dalam kumpulan data
Ada dua keuntungan utama menggunakan mean untuk mendeskripsikan “pusat” atau “rata-rata” kumpulan data:
Keuntungan #1: Rata-rata menggunakan semua observasi dari kumpulan data dalam perhitungannya. Dalam statistik, hal ini umumnya merupakan hal yang baik karena dikatakan menggunakan semua informasi yang tersedia dalam suatu kumpulan data.
Keuntungan #2: Rata-rata mudah dihitung dan diinterpretasikan. Rata-rata adalah jumlah seluruh observasi dibagi dengan jumlah total observasi. Mudah dihitung (bahkan secara manual) dan mudah diinterpretasikan.
Namun, penggunaan mean untuk meringkas kumpulan data memiliki dua potensi kelemahan:
Kerugian #1: Rata-rata dipengaruhi oleh outlier. Jika kumpulan data memiliki outlier ekstrem, hal ini akan memengaruhi mean dan menjadikannya ukuran pusat kumpulan data yang tidak dapat diandalkan.
Kerugian #2: Rata-rata dapat menyesatkan dengan kumpulan data yang tidak tepat. Saat kumpulan data dimiringkan ke kiri atau ke kanan , rata-rata dapat menjadi cara yang menyesatkan dalam mengukur pusat kumpulan data.
Contoh berikut menggambarkan keuntungan dan kerugian dalam praktiknya.
Contoh 1: Manfaat Menggunakan Rata-rata
Misalkan kita memiliki histogram berikut yang menunjukkan gaji penduduk kota tertentu:
Karena distribusi ini umumnya simetris (jika Anda membaginya di tengah-tengah, masing-masing setengahnya akan terlihat kira-kira sama) dan tidak ada outlier, mean adalah cara yang berguna untuk menggambarkan pusat kumpulan data ini.
Rata-ratanya adalah $63.000, yang kira-kira berada di tengah distribusi:
Dalam contoh khusus ini, kami dapat menggunakan kedua keuntungan dari rata-rata:
Keuntungan #1: Rata-rata menggunakan semua observasi dari kumpulan data dalam perhitungannya.
Karena distribusinya pada dasarnya simetris dan tidak ada outlier yang ekstrem, kami dapat menggunakan semua gaji yang tersedia untuk menghitung rata-rata, sehingga memberi kami gambaran bagus tentang gaji “rata-rata” atau “tipikal” di kota tertentu.
Keuntungan #2: Rata-rata mudah dihitung dan diinterpretasikan. Sangat mudah untuk memahami bahwa gaji rata-rata sebesar $63.000 mewakili gaji “rata-rata” seseorang di kota ini.
Meskipun beberapa individu berpenghasilan lebih dari ini dan yang lain jauh lebih sedikit, nilai rata-rata ini memberi kita gambaran bagus tentang gaji “tipikal” di kota ini.
Contoh 2: Kerugian Menggunakan Rata-rata
Misalkan kita mempunyai distribusi gaji yang sangat tidak seimbang dan kita memutuskan untuk menghitung gaji rata-rata dan median:
Nilai yang lebih tinggi di bagian ekor distribusi memindahkan mean menjauhi pusat dan menuju ekor panjang.
Dalam contoh ini, rata-rata menunjukkan bahwa rata-rata individu berpenghasilan sekitar $47.000 per tahun, sedangkan median menunjukkan bahwa rata-rata individu hanya berpenghasilan sekitar $32.000 per tahun, yang lebih mewakili rata-rata individu.
Dalam contoh ini, mean tidak merangkum nilai “tipikal” atau “rata-rata” dalam distribusi ini dengan buruk karena distribusinya miring.
Atau misalkan kita memiliki distribusi lain yang berisi informasi tentang luas rumah di jalan tertentu dan kita memutuskan untuk menghitung mean dan median dari kumpulan data tersebut:
Rata-ratanya dipengaruhi oleh beberapa rumah yang sangat besar, menyebabkannya mengambil nilai yang jauh lebih tinggi.
Hal ini membuat nilai rata-rata ukuran luas persegi menyesatkan dan memberikan ukuran yang buruk tentang luas persegi “khas” sebuah rumah di jalan tersebut.
Sumber daya tambahan
Tutorial berikut memberikan informasi tambahan tentang mean dan median dalam statistik:
Bagaimana pengaruh outlier terhadap mean?
Cara memperkirakan mean dan median histogram apa pun
Cara mencari mean dan median petak batang dan daun