วิธีค้นหาค่าผิดปกติใน google ชีตอย่างง่ายดาย


ค่าผิดปกติ คือการสังเกตที่อยู่ห่างจากค่าอื่นๆ ในชุดข้อมูลอย่างผิดปกติ

เรามักจะนิยามการสังเกตว่าเป็นค่าผิดปกติหากเป็น 1.5 เท่าของพิสัยระหว่างควอไทล์เหนือควอร์ไทล์ที่ 3 หรือ 1.5 เท่าของพิสัยระหว่างควอร์ไทล์ที่ต่ำกว่าควอไทล์ที่ 1

หมายเหตุ: ช่วงระหว่างควอร์ไทล์คือความแตกต่างระหว่างควอไทล์ที่สาม (เปอร์เซ็นไทล์ที่ 75) และควอร์ไทล์ที่หนึ่ง (เปอร์เซ็นไทล์ที่ 25) ของชุดข้อมูล โดยจะวัดการกระจายของค่าเฉลี่ย 50% ของค่า

ตัวอย่างทีละขั้นตอนต่อไปนี้แสดงวิธีใช้สูตรนี้เพื่อค้นหาค่าผิดปกติในชุดข้อมูลใน Google ชีต

ขั้นตอนที่ 1: ป้อนข้อมูล

ขั้นแรก ให้ป้อนค่าจากชุดข้อมูลต่อไปนี้ลงใน Google ชีต:

ขั้นตอนที่ 2: คำนวณช่วงระหว่างควอไทล์

ต่อไป มาคำนวณควอร์ไทล์ที่หนึ่ง ควอไทล์ที่สาม และช่วงระหว่างควอไทล์ของชุดข้อมูล:

ขั้นตอนที่ 3: ระบุค่าผิดปกติ

จากนั้นเราสามารถใช้สูตรต่อไปนี้เพื่อกำหนด “1” ให้กับค่าผิดปกติใดๆ ในชุดข้อมูล:

 = IF ( A2 < $B$18 - $B$20 * 1.5 , 1 , IF ( A2 > $B$19 + $B$20 * 1.5 , 1 , 0 ) )

สูตรนี้จะตรวจสอบว่าการสังเกตมีค่าเป็น 1.5 เท่าของพิสัยระหว่างควอไทล์เหนือควอไทล์ที่ 3 หรือ 1.5 เท่าของพิสัยระหว่างควอไทล์ที่ต่ำกว่าควอไทล์ที่ 1

หากข้อใดข้อหนึ่งเป็นจริง การสังเกตจะถูกกำหนดให้เป็น “1” เพื่อระบุว่าเป็นค่าผิดปกติ

ภาพหน้าจอต่อไปนี้แสดงวิธีใช้สูตรนี้ในทางปฏิบัติ:

ค้นหาค่าผิดปกติใน Google ชีต

เราเห็นว่ามีเพียงค่าเดียวในชุดข้อมูลของเราที่กลายเป็นค่าผิดปกติ: 164

วิธีจัดการกับค่าผิดปกติ

หากมีค่าผิดปกติในข้อมูลของคุณ คุณจะมีหลายตัวเลือก:

1. ตรวจสอบให้แน่ใจว่าค่าผิดปกติไม่ได้เป็นผลมาจากข้อผิดพลาดในการป้อนข้อมูล

บางครั้งข้อมูลธรรมดาก็ถูกบันทึกอย่างไม่ถูกต้อง หากมีค่าผิดปกติ ให้ตรวจสอบก่อนว่าค่าที่ป้อนถูกต้องและไม่ใช่ข้อผิดพลาด

2. กำหนดค่าใหม่ให้กับค่าผิดปกติ

หากค่าผิดปกติเป็นผลมาจากข้อผิดพลาดในการป้อนข้อมูล คุณอาจตัดสินใจกำหนดค่าใหม่ เช่น ค่าเฉลี่ยหรือค่ามัธยฐานของชุดข้อมูล

3. ถอดค่าผิดปกติออก

หากค่านั้นเป็นค่าผิดปกติจริงๆ คุณสามารถเลือกที่จะลบค่านั้นออกได้หากจะมีผลกระทบสำคัญต่อการวิเคราะห์โดยรวมของคุณ เพียงอย่าลืมระบุในรายงานขั้นสุดท้ายของคุณว่าคุณได้ลบค่าผิดปกติออก

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีลบค่าผิดปกติในซอฟต์แวร์ทางสถิติอื่นๆ:

วิธีลบค่าผิดปกติใน R
วิธีลบค่าผิดปกติใน Python
วิธีลบค่าผิดปกติใน SPSS

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *