Kriteria chauvenet: definisi & contoh


Outlier adalah observasi yang jaraknya sangat jauh dari nilai lain dalam kumpulan data. Pencilan dapat menjadi masalah karena dapat mempengaruhi hasil analisis.

Salah satu cara untuk mengidentifikasi outlier dalam kumpulan data adalah dengan menggunakan kriteria Chauvenet , yang menggunakan proses berikut:

1. Untuk setiap nilai x i dalam kumpulan data, hitung deviasi dari mean sebagai berikut:

Deviasi = |x sayax | /S

di mana x adalah mean sampel dan s adalah deviasi standar sampel.

2. Bandingkan deviasi masing-masing nilai individu dengan nilai kritis pada tabel kriteria Chauvenet di bawah ini. Untuk nilai data individual dengan deviasi lebih besar dari yang terdapat pada tabel, laporkan nilai data tersebut sebagai outlier.

Tabel kriteria Chauvenet

Kriteria Chauvenet: sebuah contoh

Misalkan kita memiliki kumpulan data berikut yang terdiri dari 15 nilai:

Rata-rata sampel untuk kumpulan data ini adalah x = 17,067 dan simpangan baku sampel adalah s = 10,096 . Untuk setiap nilai data individual, kita dapat menghitung deviasinya sebagai berikut:

Deviasi = |x sayax | /S

Misalnya:

  • Nilai data pertama mempunyai deviasi |4 – 17.067| / 10.096 = 1.294 .
  • Nilai data pertama mempunyai deviasi |6 – 17.067| / 10.096 = 1.096 .

Dan seterusnya.

Kita dapat menggunakan rumus yang sama untuk menghitung deviasi setiap nilai data:

Contoh kriteria Chauvenet

Kita kemudian dapat merujuk ke tabel kriteria Chauvenet dan mencatat bahwa nilai kritis yang sesuai dengan ukuran sampel n=15 adalah 2,128 . Oleh karena itu, nilai apa pun yang deviasinya lebih besar dari 2,128 dapat dianggap sebagai outlier.

Ternyata nilai 42 mempunyai deviasi lebih besar dari 2,128:

Contoh kriteria Chauvenet untuk mendeteksi outlier

Jadi, nilai 42 adalah satu-satunya outlier dalam kumpulan data ini.

Tindakan pencegahan terkait penggunaan kriteria Chauvenet

Kriteria Chauvenet mengasumsikan bahwa nilai-nilai dalam suatu kumpulan data terdistribusi secara normal . Jika asumsi ini tidak terpenuhi, penggunaan kriteria Chauvenet untuk mengidentifikasi outlier kemungkinan besar tidak valid.

Jika Anda menggunakan metode ini dan menemukan bahwa suatu nilai adalah outlier, Anda harus terlebih dahulu memverifikasi bahwa nilai tersebut bukan hasil dari kesalahan entri data. Terkadang data yang dimasukkan salah.

Jika nilainya benar-benar outlier, Anda dapat memilih untuk menghapusnya jika nilai tersebut akan berdampak signifikan pada analisis Anda secara keseluruhan. Pastikan untuk menyebutkan bahwa Anda menghapus outlier saat melaporkan hasil Anda.

Selain itu, metode ini hanya boleh digunakan satu kali pada kumpulan data tertentu. Misalnya, kita menggunakan kriteria ini untuk mengidentifikasi nilai 42 sebagai outlier pada contoh sebelumnya dan menghapus nilai tersebut dari kumpulan data.

Maka kita tidak boleh menghitung ulang mean sampel dan deviasi standar sampel, lalu menghitung deviasinya lagi untuk menemukan lebih banyak outlier.

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *