วิธีค้นหาค่าผิดปกติใน google ชีตอย่างง่ายดาย
ค่าผิดปกติ คือการสังเกตที่อยู่ห่างจากค่าอื่นๆ ในชุดข้อมูลอย่างผิดปกติ
เรามักจะนิยามการสังเกตว่าเป็นค่าผิดปกติหากเป็น 1.5 เท่าของพิสัยระหว่างควอไทล์เหนือควอร์ไทล์ที่ 3 หรือ 1.5 เท่าของพิสัยระหว่างควอร์ไทล์ที่ต่ำกว่าควอไทล์ที่ 1
หมายเหตุ: ช่วงระหว่างควอร์ไทล์คือความแตกต่างระหว่างควอไทล์ที่สาม (เปอร์เซ็นไทล์ที่ 75) และควอร์ไทล์ที่หนึ่ง (เปอร์เซ็นไทล์ที่ 25) ของชุดข้อมูล โดยจะวัดการกระจายของค่าเฉลี่ย 50% ของค่า
ตัวอย่างทีละขั้นตอนต่อไปนี้แสดงวิธีใช้สูตรนี้เพื่อค้นหาค่าผิดปกติในชุดข้อมูลใน Google ชีต
ขั้นตอนที่ 1: ป้อนข้อมูล
ขั้นแรก ให้ป้อนค่าจากชุดข้อมูลต่อไปนี้ลงใน Google ชีต:
ขั้นตอนที่ 2: คำนวณช่วงระหว่างควอไทล์
ต่อไป มาคำนวณควอร์ไทล์ที่หนึ่ง ควอไทล์ที่สาม และช่วงระหว่างควอไทล์ของชุดข้อมูล:
ขั้นตอนที่ 3: ระบุค่าผิดปกติ
จากนั้นเราสามารถใช้สูตรต่อไปนี้เพื่อกำหนด “1” ให้กับค่าผิดปกติใดๆ ในชุดข้อมูล:
= IF ( A2 < $B$18 - $B$20 * 1.5 , 1 , IF ( A2 > $B$19 + $B$20 * 1.5 , 1 , 0 ) )
สูตรนี้จะตรวจสอบว่าการสังเกตมีค่าเป็น 1.5 เท่าของพิสัยระหว่างควอไทล์เหนือควอไทล์ที่ 3 หรือ 1.5 เท่าของพิสัยระหว่างควอไทล์ที่ต่ำกว่าควอไทล์ที่ 1
หากข้อใดข้อหนึ่งเป็นจริง การสังเกตจะถูกกำหนดให้เป็น “1” เพื่อระบุว่าเป็นค่าผิดปกติ
ภาพหน้าจอต่อไปนี้แสดงวิธีใช้สูตรนี้ในทางปฏิบัติ:
เราเห็นว่ามีเพียงค่าเดียวในชุดข้อมูลของเราที่กลายเป็นค่าผิดปกติ: 164
วิธีจัดการกับค่าผิดปกติ
หากมีค่าผิดปกติในข้อมูลของคุณ คุณจะมีหลายตัวเลือก:
1. ตรวจสอบให้แน่ใจว่าค่าผิดปกติไม่ได้เป็นผลมาจากข้อผิดพลาดในการป้อนข้อมูล
บางครั้งข้อมูลธรรมดาก็ถูกบันทึกอย่างไม่ถูกต้อง หากมีค่าผิดปกติ ให้ตรวจสอบก่อนว่าค่าที่ป้อนถูกต้องและไม่ใช่ข้อผิดพลาด
2. กำหนดค่าใหม่ให้กับค่าผิดปกติ
หากค่าผิดปกติเป็นผลมาจากข้อผิดพลาดในการป้อนข้อมูล คุณอาจตัดสินใจกำหนดค่าใหม่ เช่น ค่าเฉลี่ยหรือค่ามัธยฐานของชุดข้อมูล
3. ถอดค่าผิดปกติออก
หากค่านั้นเป็นค่าผิดปกติจริงๆ คุณสามารถเลือกที่จะลบค่านั้นออกได้หากจะมีผลกระทบสำคัญต่อการวิเคราะห์โดยรวมของคุณ เพียงอย่าลืมระบุในรายงานขั้นสุดท้ายของคุณว่าคุณได้ลบค่าผิดปกติออก
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีลบค่าผิดปกติในซอฟต์แวร์ทางสถิติอื่นๆ:
วิธีลบค่าผิดปกติใน R
วิธีลบค่าผิดปกติใน Python
วิธีลบค่าผิดปกติใน SPSS