Data yang dipotong & disensor: definisi + contoh
Seringkali, ketika mengumpulkan data, peneliti memutuskan untuk menyensor atau memotong nilai-nilai tertentu.
Menyensor nilai data berarti mengumpulkan hanya sebagian informasi tentang nilai di bawah atau di atas nilai tertentu.
Misalnya, kita mungkin mengetahui bahwa seseorang berpenghasilan kurang dari $25.000 per tahun, namun kita mungkin tidak mengetahui secara pasti pendapatan tahunannya.
Memotong nilai data berarti menghilangkan nilai dari suatu kumpulan data yang berada di bawah atau di atas nilai tertentu.
Misalnya, seorang peneliti mungkin hanya tertarik pada individu yang berpenghasilan lebih dari $25.000 per tahun. Jadi, siapa pun yang berpenghasilan kurang dari $25.000 akan dikeluarkan dari kumpulan data.
Tutorial ini memberikan beberapa contoh kapan data mungkin disensor atau dipotong.
Sensor data
Menyensor nilai data berarti mengumpulkan hanya sebagian informasi tentang nilai di bawah atau di atas nilai tertentu.
Contoh berikut mengilustrasikan skenario di mana kita mungkin memutuskan untuk menyensor nilai data.
Contoh 1: Pendapatan tahunan
Misalkan seorang peneliti mengumpulkan data survei tentang pendapatan tahunan. Jika seseorang berpenghasilan kurang dari $25.000 per tahun, mereka memutuskan untuk melaporkan pendapatan ini sebagai “<$25.000” dalam database daripada menentukan pendapatan tahunan pastinya.
Ini merupakan contoh penyensoran data karena kita mengetahui bahwa seseorang berpenghasilan kurang dari jumlah tertentu, namun kita tidak mengetahui secara pasti pendapatan tahunannya.
Contoh 2: tingkat polusi
Misalkan seorang ahli biologi menggunakan alat tertentu untuk mengukur tingkat polusi di berbagai perairan. Alatnya tidak mampu mengukur polusi di bawah 0,002 bagian per juta. Oleh karena itu, setiap perairan dengan tingkat polusi di bawah ambang batas ini hanya akan dilaporkan sebagai “<0,002” dan bukan jumlah pastinya.
Hal ini merupakan contoh sensor data karena kita mengetahui bahwa beberapa perairan memiliki tingkat polusi di bawah 0,002 bagian per juta, namun kita tidak mengetahui tingkat polusi pastinya .
Potong data
Memotong nilai data berarti menghilangkan nilai dari suatu kumpulan data yang berada di bawah atau di atas nilai tertentu.
Contoh berikut mengilustrasikan skenario di mana kita mungkin memutuskan untuk memotong nilai data.
Contoh 1: Jumlah kejahatan
Misalkan seorang aparat penegak hukum sedang meneliti jenis-jenis kejahatan yang dilakukan oleh individu di suatu daerah tertentu. Secara default, siapa pun yang melakukan 0 kejahatan tidak akan dimasukkan dalam dataset karena mereka tidak melakukan jenis kejahatan apa pun.
Ini merupakan contoh data yang terpotong, karena siapa pun yang tidak melakukan kejahatan akan dikeluarkan dari kumpulan data sepenuhnya.
Contoh 2: Tingkat pendidikan
Misalkan seorang profesor ingin mempelajari hubungan antara kurikulum tertentu dan hasil siswa.
Karena padatnya kurikulum, maka dosen ingin hanya mengikuti mahasiswa yang saat ini memiliki IPK di atas 3,5. Oleh karena itu, siswa mana pun yang mendaftar ke program ini tetapi memiliki IPK di bawah 3,5 tidak akan diikutsertakan dalam program ini.
Ini merupakan contoh data yang terpotong, karena siapa pun yang IPKnya di bawah ambang batas tertentu akan dikeluarkan dari kumpulan data.
Ringkasan
Menyensor data berarti mengumpulkan hanya sebagian informasi tentang nilai data dan memotong data berarti menghapus seluruh nilai data dari kumpulan data.
Penyensoran dan pemotongan mengakibatkan hilangnya informasi dalam kumpulan data, namun pemotongan mengakibatkan hilangnya informasi yang lebih besar karena melibatkan pengecualian total nilai data tertentu.