Apa yang dimaksud dengan skor z yang dimodifikasi? (definisi & #038; contoh)
Dalam statistik, skor-z memberi tahu kita berapa banyak standar deviasi suatu nilai dari mean . Kami menggunakan rumus berikut untuk menghitung skor-z:
Skor Z = ( xi – μ) / σ
Emas:
- x i : nilai data tunggal
- μ: rata-rata kumpulan data
- σ : deviasi standar kumpulan data
Skor Z sering digunakan untuk mendeteksi outlier dalam suatu kumpulan data. Misalnya, observasi dengan skor-z kurang dari -3 atau lebih besar dari 3 sering kali dianggap outlier.
Namun, skor-z dapat dipengaruhi oleh nilai data yang sangat besar atau kecil. Inilah sebabnya cara yang lebih kuat untuk mendeteksi outlier adalah dengan menggunakan z-score yang dimodifikasi , yang dihitung sebagai berikut:
Skor-z yang dimodifikasi = 0,6745 ( xi – x̃) / MAD
Emas:
- x i : nilai data tunggal
- x̃ : Median kumpulan data
- MAD: deviasi absolut median dari kumpulan data
Skor-z yang dimodifikasi lebih kuat karena menggunakan median untuk menghitung skor-z, dibandingkan dengan rata-rata, yang diketahui dipengaruhi oleh outlier .
Iglewicz dan Hoaglin merekomendasikan agar nilai dengan skor z yang dimodifikasi kurang dari -3,5 atau lebih besar dari 3,5 diberi label sebagai potensi outlier.
Contoh langkah demi langkah berikut menunjukkan cara menghitung skor-z yang dimodifikasi untuk kumpulan data tertentu.
Langkah 1: Buat datanya
Misalkan kita memiliki kumpulan data berikut dengan 16 nilai:
Langkah 2: Temukan Median
Selanjutnya kita cari mediannya. Ini mewakili titik tengah kumpulan data, yang ternyata adalah 16 .
Langkah 3: Temukan perbedaan absolut antara setiap nilai dan median
Selanjutnya, kita akan mencari selisih mutlak antara setiap nilai data individu dan mediannya. Misalnya, selisih mutlak antara nilai data pertama dan median dihitung sebagai berikut:
Beda mutlak = |6 – 16| = 10
Kita dapat menggunakan rumus yang sama untuk menghitung selisih absolut antara setiap nilai data individual dan median:
Langkah 4: Temukan Deviasi Median Absolut
Selanjutnya, kita akan mencari deviasi median absolut. Ini adalah median kolom kedua, yang ternyata adalah 8 .
Langkah 5: Temukan skor Z yang dimodifikasi untuk setiap nilai data
Terakhir, kita dapat menghitung skor-z yang dimodifikasi untuk setiap nilai data menggunakan rumus berikut:
Skor-z yang dimodifikasi = 0,6745 ( xi – x̃) / MAD
Misalnya, skor-z yang dimodifikasi untuk nilai data pertama dihitung sebagai berikut:
Skor-z yang dimodifikasi = 0,6745*(6-16) / 8 = -0,843
Kita dapat mengulangi rumus ini untuk setiap nilai dalam kumpulan data:
Kita dapat melihat bahwa tidak ada nilai dalam kumpulan data yang memiliki skor-z yang dimodifikasi kurang dari -3,5 atau lebih besar dari 3,5, jadi kami tidak memberi label nilai apa pun dalam kumpulan data ini sebagai potensi outlier.
Cara menangani outlier
Jika ada outlier di kumpulan data Anda, Anda memiliki beberapa opsi:
- Pastikan outlier tersebut bukan akibat kesalahan entri data. Terkadang seseorang memasukkan nilai data yang salah saat menyimpan data. Jika terdapat outlier, verifikasi terlebih dahulu bahwa nilai yang dimasukkan benar dan bukan kesalahan.
- Tetapkan nilai baru pada outlier . Jika outlier ternyata disebabkan oleh kesalahan entri data, Anda dapat memutuskan untuk memberinya nilai baru seperti mean atau median kumpulan data.
- Hapus outlier. Jika nilainya benar-benar outlier, Anda dapat memilih untuk menghapusnya jika nilai tersebut akan berdampak signifikan pada analisis Anda secara keseluruhan. Pastikan untuk menyebutkan dalam laporan akhir atau analisis Anda bahwa Anda telah menghapus outlier.