Cara mudah menemukan pencilan di google spreadsheet
Outlier adalah observasi yang jaraknya sangat jauh dari nilai lain dalam kumpulan data.
Kita sering mendefinisikan suatu observasi sebagai outlier jika observasi tersebut 1,5 kali rentang antarkuartil di atas kuartil ketiga atau 1,5 kali rentang antarkuartil di bawah kuartil pertama.
Catatan: Rentang interkuartil adalah selisih antara kuartil ketiga (persentil ke-75) dan kuartil pertama (persentil ke-25) suatu kumpulan data. Ini mengukur distribusi rata-rata 50% nilai.
Contoh langkah demi langkah berikut menunjukkan cara menggunakan rumus ini untuk menemukan outlier dalam kumpulan data di Google Spreadsheet.
Langkah 1: Masukkan datanya
Pertama, masukkan nilai dari kumpulan data berikut ke Google Spreadsheet:
Langkah 2: Hitung rentang interkuartil
Selanjutnya, mari kita hitung rentang kuartil pertama, kuartil ketiga, dan interkuartil dari kumpulan data:
Langkah 3: Identifikasi Pencilan
Kemudian kita bisa menggunakan rumus berikut untuk memberikan nilai “1” pada outlier mana pun dalam kumpulan data:
= IF ( A2 < $B$18 - $B$20 * 1.5 , 1 , IF ( A2 > $B$19 + $B$20 * 1.5 , 1 , 0 ) )
Rumus ini memeriksa apakah suatu pengamatan 1,5 kali rentang antarkuartil di atas kuartil ketiga atau 1,5 kali rentang antarkuartil di bawah kuartil pertama.
Jika salah satu benar, observasi tersebut diberi nilai “1” untuk menetapkannya sebagai outlier.
Tangkapan layar berikut menunjukkan cara menggunakan rumus ini dalam praktik:
Kami melihat bahwa hanya satu nilai dalam kumpulan data kami yang merupakan outlier: 164 .
Cara menangani outlier
Jika ada outlier dalam data Anda, Anda memiliki beberapa opsi:
1. Pastikan outlier tersebut bukan akibat kesalahan entri data.
Terkadang data sederhana tidak disimpan dengan benar. Jika terdapat outlier, verifikasi terlebih dahulu bahwa nilai yang dimasukkan benar dan bukan kesalahan.
2. Tetapkan nilai baru pada outlier .
Jika outlier adalah akibat dari kesalahan entri data, Anda dapat memutuskan untuk memberinya nilai baru seperti mean atau median dari kumpulan data.
3. Hapus outlier.
Jika nilainya benar-benar outlier, Anda dapat memilih untuk menghapusnya jika nilai tersebut akan berdampak signifikan pada analisis Anda secara keseluruhan. Pastikan untuk menyebutkan dalam laporan akhir Anda bahwa Anda menghapus outlier.
Sumber daya tambahan
Tutorial berikut menjelaskan cara menghilangkan outlier pada software statistik lainnya:
Cara menghilangkan outlier di R
Cara Menghapus Pencilan dengan Python
Cara menghilangkan outlier di SPSS