วิธีค้นหาค่าผิดปกติใน excel ได้อย่างง่ายดาย


ค่าผิดปกติ คือ การสังเกต ที่อยู่ห่างจากค่าอื่นๆ ในชุดข้อมูลอย่างผิดปกติ

ค่าผิดปกติอาจเป็นปัญหาได้เนื่องจากอาจส่งผลต่อผลลัพธ์ของการวิเคราะห์

เราจะใช้ชุดข้อมูลต่อไปนี้ใน Excel เพื่อสาธิตวิธีการสองวิธีในการค้นหาค่าผิดปกติ:

ที่เกี่ยวข้อง: วิธีการคำนวณค่าเฉลี่ยไม่รวมค่าผิดปกติใน Excel

วิธีที่ 1: ใช้ช่วงระหว่างควอไทล์

ช่วงระหว่างควอไทล์ (IQR) คือความแตกต่างระหว่างเปอร์เซ็นไทล์ที่ 75 (Q3) และเปอร์เซ็นไทล์ที่ 25 (Q1) ในชุดข้อมูล โดยจะวัดการกระจายของค่าเฉลี่ย 50% ของค่า

เราสามารถกำหนดให้การสังเกตเป็นค่าผิดปกติได้หากเป็น 1.5 เท่าของพิสัยระหว่างควอไทล์เหนือควอไทล์ที่ 3 (Q3) หรือ 1.5 เท่าของพิสัยระหว่างควอไทล์ที่ต่ำกว่าควอร์ไทล์ที่ 1 (Q1)

รูปภาพต่อไปนี้แสดงวิธีการคำนวณช่วงระหว่างควอไทล์ใน Excel:

จากนั้นเราสามารถใช้สูตรที่กล่าวถึงข้างต้นเพื่อกำหนด “1” ให้กับค่าผิดปกติใดๆ ในชุดข้อมูล:

ค้นหาค่าผิดปกติใน Excel

เราพบว่ามีเพียงค่าเดียวเท่านั้นคือ 164 ซึ่งกลายเป็นค่าผิดปกติในชุดข้อมูลนี้

วิธีที่ 2: ใช้คะแนน z

คะแนน z จะบอกคุณว่าค่าที่กำหนดมาจากค่าเฉลี่ยเป็นจำนวนเท่าใด เราใช้สูตรต่อไปนี้เพื่อคำนวณคะแนน z:

z = (X – μ) / σ

ทอง:

  • X คือค่าข้อมูลดิบค่าเดียว
  • μ คือค่าเฉลี่ยของประชากร
  • σ คือค่าเบี่ยงเบนมาตรฐานของประชากร

เราสามารถนิยามการสังเกตว่าเป็นค่าผิดปกติได้หากมีคะแนน z น้อยกว่า -3 หรือมากกว่า 3

รูปภาพต่อไปนี้แสดงวิธีคำนวณค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของชุดข้อมูลใน Excel:

จากนั้นเราสามารถใช้ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานเพื่อค้นหาคะแนน z สำหรับแต่ละค่าในชุดข้อมูล:

จากนั้นเราสามารถกำหนด “1” ให้กับค่าใดๆ ที่มีคะแนน z น้อยกว่า -3 หรือมากกว่า 3:

การค้นหาค่าผิดปกติใน Excel โดยใช้ Z-Score

เมื่อใช้วิธีการนี้ เราจะเห็นว่าไม่มีค่าผิดปกติในชุดข้อมูล

หมายเหตุ: บางครั้งมีการใช้คะแนน z 2.5 แทน 3 ในกรณีนี้ ค่าแต่ละค่าของ 164 จะถือเป็นค่าผิดปกติเนื่องจากมีคะแนน z มากกว่า 2.5

เมื่อใช้วิธี z-score ให้ใช้วิจารณญาณของคุณเพื่อพิจารณาว่าค่า z-score ใดที่คุณพิจารณาว่าเป็นค่าผิดปกติ

วิธีจัดการกับค่าผิดปกติ

หากมีค่าผิดปกติในข้อมูลของคุณ คุณจะมีหลายตัวเลือก:

1. ตรวจสอบให้แน่ใจว่าค่าผิดปกติไม่ได้เป็นผลมาจากข้อผิดพลาดในการป้อนข้อมูล

บางครั้งบุคคลเพียงแต่กรอกค่าข้อมูลที่ไม่ถูกต้องในขณะที่บันทึกข้อมูล หากมีค่าผิดปกติ ให้ตรวจสอบก่อนว่าค่าที่ป้อนถูกต้องและไม่ใช่ข้อผิดพลาด

2. ถอดค่าผิดปกติออก

หากค่านั้นเป็นค่าผิดปกติจริงๆ คุณสามารถเลือกที่จะลบค่านั้นออกได้หากจะมีผลกระทบสำคัญต่อการวิเคราะห์โดยรวมของคุณ เพียงอย่าลืมพูดถึงในรายงานหรือการวิเคราะห์ขั้นสุดท้ายของคุณว่าคุณได้ลบค่าผิดปกติออก

3. กำหนดค่าใหม่ให้กับค่าผิดปกติ

หากค่าผิดปกติเป็นผลมาจากข้อผิดพลาดในการป้อนข้อมูล คุณอาจตัดสินใจกำหนดค่าใหม่ เช่น ค่าเฉลี่ยหรือค่ามัธยฐาน ของชุดข้อมูล

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *