วิธีค้นหาค่าผิดปกติใน excel ได้อย่างง่ายดาย
ค่าผิดปกติ คือ การสังเกต ที่อยู่ห่างจากค่าอื่นๆ ในชุดข้อมูลอย่างผิดปกติ
ค่าผิดปกติอาจเป็นปัญหาได้เนื่องจากอาจส่งผลต่อผลลัพธ์ของการวิเคราะห์
เราจะใช้ชุดข้อมูลต่อไปนี้ใน Excel เพื่อสาธิตวิธีการสองวิธีในการค้นหาค่าผิดปกติ:
ที่เกี่ยวข้อง: วิธีการคำนวณค่าเฉลี่ยไม่รวมค่าผิดปกติใน Excel
วิธีที่ 1: ใช้ช่วงระหว่างควอไทล์
ช่วงระหว่างควอไทล์ (IQR) คือความแตกต่างระหว่างเปอร์เซ็นไทล์ที่ 75 (Q3) และเปอร์เซ็นไทล์ที่ 25 (Q1) ในชุดข้อมูล โดยจะวัดการกระจายของค่าเฉลี่ย 50% ของค่า
เราสามารถกำหนดให้การสังเกตเป็นค่าผิดปกติได้หากเป็น 1.5 เท่าของพิสัยระหว่างควอไทล์เหนือควอไทล์ที่ 3 (Q3) หรือ 1.5 เท่าของพิสัยระหว่างควอไทล์ที่ต่ำกว่าควอร์ไทล์ที่ 1 (Q1)
รูปภาพต่อไปนี้แสดงวิธีการคำนวณช่วงระหว่างควอไทล์ใน Excel:
จากนั้นเราสามารถใช้สูตรที่กล่าวถึงข้างต้นเพื่อกำหนด “1” ให้กับค่าผิดปกติใดๆ ในชุดข้อมูล:
เราพบว่ามีเพียงค่าเดียวเท่านั้นคือ 164 ซึ่งกลายเป็นค่าผิดปกติในชุดข้อมูลนี้
วิธีที่ 2: ใช้คะแนน z
คะแนน z จะบอกคุณว่าค่าที่กำหนดมาจากค่าเฉลี่ยเป็นจำนวนเท่าใด เราใช้สูตรต่อไปนี้เพื่อคำนวณคะแนน z:
z = (X – μ) / σ
ทอง:
- X คือค่าข้อมูลดิบค่าเดียว
- μ คือค่าเฉลี่ยของประชากร
- σ คือค่าเบี่ยงเบนมาตรฐานของประชากร
เราสามารถนิยามการสังเกตว่าเป็นค่าผิดปกติได้หากมีคะแนน z น้อยกว่า -3 หรือมากกว่า 3
รูปภาพต่อไปนี้แสดงวิธีคำนวณค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของชุดข้อมูลใน Excel:
จากนั้นเราสามารถใช้ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานเพื่อค้นหาคะแนน z สำหรับแต่ละค่าในชุดข้อมูล:
จากนั้นเราสามารถกำหนด “1” ให้กับค่าใดๆ ที่มีคะแนน z น้อยกว่า -3 หรือมากกว่า 3:
เมื่อใช้วิธีการนี้ เราจะเห็นว่าไม่มีค่าผิดปกติในชุดข้อมูล
หมายเหตุ: บางครั้งมีการใช้คะแนน z 2.5 แทน 3 ในกรณีนี้ ค่าแต่ละค่าของ 164 จะถือเป็นค่าผิดปกติเนื่องจากมีคะแนน z มากกว่า 2.5
เมื่อใช้วิธี z-score ให้ใช้วิจารณญาณของคุณเพื่อพิจารณาว่าค่า z-score ใดที่คุณพิจารณาว่าเป็นค่าผิดปกติ
วิธีจัดการกับค่าผิดปกติ
หากมีค่าผิดปกติในข้อมูลของคุณ คุณจะมีหลายตัวเลือก:
1. ตรวจสอบให้แน่ใจว่าค่าผิดปกติไม่ได้เป็นผลมาจากข้อผิดพลาดในการป้อนข้อมูล
บางครั้งบุคคลเพียงแต่กรอกค่าข้อมูลที่ไม่ถูกต้องในขณะที่บันทึกข้อมูล หากมีค่าผิดปกติ ให้ตรวจสอบก่อนว่าค่าที่ป้อนถูกต้องและไม่ใช่ข้อผิดพลาด
2. ถอดค่าผิดปกติออก
หากค่านั้นเป็นค่าผิดปกติจริงๆ คุณสามารถเลือกที่จะลบค่านั้นออกได้หากจะมีผลกระทบสำคัญต่อการวิเคราะห์โดยรวมของคุณ เพียงอย่าลืมพูดถึงในรายงานหรือการวิเคราะห์ขั้นสุดท้ายของคุณว่าคุณได้ลบค่าผิดปกติออก
3. กำหนดค่าใหม่ให้กับค่าผิดปกติ
หากค่าผิดปกติเป็นผลมาจากข้อผิดพลาดในการป้อนข้อมูล คุณอาจตัดสินใจกำหนดค่าใหม่ เช่น ค่าเฉลี่ยหรือค่ามัธยฐาน ของชุดข้อมูล