ข้อมูลที่ถูกตัดทอนและเซ็นเซอร์: คำจำกัดความ + ตัวอย่าง
บ่อยครั้งเมื่อรวบรวมข้อมูล นักวิจัยอาจตัดสินใจ เซ็นเซอร์ หรือ ตัดทอน ค่าบางอย่าง
การเซ็นเซอร์ ค่าข้อมูลหมายถึงการรวบรวมข้อมูลเพียงบางส่วนเกี่ยวกับค่าที่ต่ำกว่าหรือสูงกว่าค่าที่กำหนด
ตัวอย่างเช่น เราอาจรู้ว่าบุคคลมีรายได้น้อยกว่า 25,000 เหรียญสหรัฐต่อปี แต่เราอาจไม่ทราบรายได้ต่อปีที่แน่นอนของพวกเขา

การตัดทอน ค่าข้อมูลหมายถึงการลบค่าออกจากชุดข้อมูลที่ต่ำกว่าหรือสูงกว่าค่าที่กำหนด
ตัวอย่างเช่น นักวิจัยอาจสนใจเฉพาะบุคคลที่มีรายได้มากกว่า 25,000 ดอลลาร์ต่อปีเท่านั้น ดังนั้น ใครก็ตามที่มีรายได้น้อยกว่า 25,000 ดอลลาร์จะถูกลบออกจากชุดข้อมูล

บทช่วยสอนนี้ให้ตัวอย่างหลายประการว่าเมื่อใดที่ข้อมูลอาจถูกเซ็นเซอร์หรือตัดทอน
การเซ็นเซอร์ข้อมูล
การเซ็นเซอร์ ค่าข้อมูลหมายถึงการรวบรวมข้อมูลเพียงบางส่วนเกี่ยวกับค่าที่ต่ำกว่าหรือสูงกว่าค่าที่กำหนด
ตัวอย่างต่อไปนี้แสดงให้เห็นถึงสถานการณ์ที่เราอาจตัดสินใจเซ็นเซอร์ค่าข้อมูล
ตัวอย่างที่ 1: รายได้ต่อปี
สมมติว่านักวิจัยรวบรวมข้อมูลการสำรวจเกี่ยวกับรายได้ต่อปี หากบุคคลมีรายได้น้อยกว่า $25,000 ต่อปี พวกเขาตัดสินใจรายงานรายได้นี้เป็น “<$25,000” ในฐานข้อมูล แทนที่จะระบุรายได้ต่อปีที่แน่นอน
นี่เป็นตัวอย่างของการเซ็นเซอร์ข้อมูล เนื่องจากเรารู้ว่าบุคคลมีรายได้น้อยกว่าจำนวนที่กำหนด แต่เราไม่ทราบรายได้ต่อปีที่ แน่นอน
ตัวอย่างที่ 2: ระดับมลภาวะ
สมมติว่านักชีววิทยาใช้เครื่องมือบางอย่างในการวัดระดับมลพิษในแหล่งน้ำต่างๆ เครื่องมือนี้ไม่สามารถวัดมลพิษได้ต่ำกว่า 0.002 ส่วนในล้านส่วน ดังนั้น แหล่งน้ำใดๆ ที่มีระดับมลพิษต่ำกว่าเกณฑ์นี้จะถูกรายงานเป็น “<0.002” แทนที่จะเป็นปริมาณที่แน่นอน
นี่เป็นตัวอย่างของการเซ็นเซอร์ข้อมูล เนื่องจากเรารู้ว่าแหล่งน้ำบางแห่งมีระดับมลพิษต่ำกว่า 0.002 ส่วนในล้านส่วน แต่เราไม่ทราบระดับมลพิษ ที่แน่นอน
ตัดทอนข้อมูล
การตัดทอน ค่าข้อมูลหมายถึงการลบค่าออกจากชุดข้อมูลที่ต่ำกว่าหรือสูงกว่าค่าที่กำหนด
ตัวอย่างต่อไปนี้แสดงให้เห็นถึงสถานการณ์ที่เราอาจตัดสินใจตัดทอนค่าข้อมูล
ตัวอย่างที่ 1: จำนวนอาชญากรรม
สมมติว่าเจ้าหน้าที่บังคับใช้กฎหมายกำลังค้นคว้าประเภทของอาชญากรรมที่บุคคลในพื้นที่หนึ่งกระทำ ตามค่าเริ่มต้น ใครก็ตามที่ก่ออาชญากรรม 0 ครั้งจะไม่รวมอยู่ในชุดข้อมูล เนื่องจากพวกเขาไม่ได้ก่ออาชญากรรมประเภทใดเลย
นี่เป็นตัวอย่างของข้อมูลที่ถูกตัดทอน เนื่องจากใครก็ตามที่ไม่ได้ก่ออาชญากรรมจะถูกแยกออกจากชุดข้อมูลโดยสิ้นเชิง
ตัวอย่างที่ 2: ระดับการศึกษา
สมมติว่าศาสตราจารย์ต้องการศึกษาความสัมพันธ์ระหว่างหลักสูตรหนึ่งกับผลลัพธ์ของนักเรียน
เนื่องจากหลักสูตรเข้มข้น อาจารย์จึงขอติดตามเฉพาะนักศึกษาที่มีเกรดเฉลี่ยสะสมสูงกว่า 3.5 เท่านั้น ดังนั้น นักเรียนที่สมัครเข้าร่วมโปรแกรมแต่มีเกรดเฉลี่ยต่ำกว่า 3.5 จะไม่รวมอยู่ในโปรแกรม
นี่เป็นตัวอย่างของข้อมูลที่ถูกตัดทอน เนื่องจากใครก็ตามที่มีเกรดเฉลี่ยต่ำกว่าเกณฑ์ที่กำหนดจะถูกแยกออกจากชุดข้อมูล
สรุป
การเซ็นเซอร์ ข้อมูลหมายถึงการรวบรวมเฉพาะข้อมูลบางส่วนเกี่ยวกับค่าข้อมูล และ การตัดทอน ข้อมูลหมายถึงการลบค่าข้อมูลออกจากชุดข้อมูลทั้งหมด
ทั้งการเซ็นเซอร์และการตัดทอนส่งผลให้ข้อมูลในชุดข้อมูลสูญหาย แต่การตัดทอนส่งผลให้สูญเสียข้อมูลมากขึ้น เนื่องจากเกี่ยวข้องกับการยกเว้นค่าข้อมูลบางอย่างโดยสิ้นเชิง