Apa yang dimaksud dengan skor z yang dimodifikasi? (definisi & #038; contoh)


Dalam statistik, skor-z memberi tahu kita berapa banyak standar deviasi suatu nilai dari mean . Kami menggunakan rumus berikut untuk menghitung skor-z:

Skor Z = ( xi – μ) / σ

Emas:

  • x i : nilai data tunggal
  • μ: rata-rata kumpulan data
  • σ : deviasi standar kumpulan data

Skor Z sering digunakan untuk mendeteksi outlier dalam suatu kumpulan data. Misalnya, observasi dengan skor-z kurang dari -3 atau lebih besar dari 3 sering kali dianggap outlier.

Namun, skor-z dapat dipengaruhi oleh nilai data yang sangat besar atau kecil. Inilah sebabnya cara yang lebih kuat untuk mendeteksi outlier adalah dengan menggunakan z-score yang dimodifikasi , yang dihitung sebagai berikut:

Skor-z yang dimodifikasi = 0,6745 ( xi – x̃) / MAD

Emas:

  • x i : nilai data tunggal
  • x̃ : Median kumpulan data
  • MAD: deviasi absolut median dari kumpulan data

Skor-z yang dimodifikasi lebih kuat karena menggunakan median untuk menghitung skor-z, dibandingkan dengan rata-rata, yang diketahui dipengaruhi oleh outlier .

Iglewicz dan Hoaglin merekomendasikan agar nilai dengan skor z yang dimodifikasi kurang dari -3,5 atau lebih besar dari 3,5 diberi label sebagai potensi outlier.

Contoh langkah demi langkah berikut menunjukkan cara menghitung skor-z yang dimodifikasi untuk kumpulan data tertentu.

Langkah 1: Buat datanya

Misalkan kita memiliki kumpulan data berikut dengan 16 nilai:

Langkah 2: Temukan Median

Selanjutnya kita cari mediannya. Ini mewakili titik tengah kumpulan data, yang ternyata adalah 16 .

Langkah 3: Temukan perbedaan absolut antara setiap nilai dan median

Selanjutnya, kita akan mencari selisih mutlak antara setiap nilai data individu dan mediannya. Misalnya, selisih mutlak antara nilai data pertama dan median dihitung sebagai berikut:

Beda mutlak = |6 – 16| = 10

Kita dapat menggunakan rumus yang sama untuk menghitung selisih absolut antara setiap nilai data individual dan median:

Langkah 4: Temukan Deviasi Median Absolut

Selanjutnya, kita akan mencari deviasi median absolut. Ini adalah median kolom kedua, yang ternyata adalah 8 .

Langkah 5: Temukan skor Z yang dimodifikasi untuk setiap nilai data

Terakhir, kita dapat menghitung skor-z yang dimodifikasi untuk setiap nilai data menggunakan rumus berikut:

Skor-z yang dimodifikasi = 0,6745 ( xi – x̃) / MAD

Misalnya, skor-z yang dimodifikasi untuk nilai data pertama dihitung sebagai berikut:

Skor-z yang dimodifikasi = 0,6745*(6-16) / 8 = -0,843

Kita dapat mengulangi rumus ini untuk setiap nilai dalam kumpulan data:

Kita dapat melihat bahwa tidak ada nilai dalam kumpulan data yang memiliki skor-z yang dimodifikasi kurang dari -3,5 atau lebih besar dari 3,5, jadi kami tidak memberi label nilai apa pun dalam kumpulan data ini sebagai potensi outlier.

Cara menangani outlier

Jika ada outlier di kumpulan data Anda, Anda memiliki beberapa opsi:

  • Pastikan outlier tersebut bukan akibat kesalahan entri data. Terkadang seseorang memasukkan nilai data yang salah saat menyimpan data. Jika terdapat outlier, verifikasi terlebih dahulu bahwa nilai yang dimasukkan benar dan bukan kesalahan.
  • Tetapkan nilai baru pada outlier . Jika outlier ternyata disebabkan oleh kesalahan entri data, Anda dapat memutuskan untuk memberinya nilai baru seperti mean atau median kumpulan data.
  • Hapus outlier. Jika nilainya benar-benar outlier, Anda dapat memilih untuk menghapusnya jika nilai tersebut akan berdampak signifikan pada analisis Anda secara keseluruhan. Pastikan untuk menyebutkan dalam laporan akhir atau analisis Anda bahwa Anda telah menghapus outlier.

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *