5 ตัวอย่างค่าผิดปกติในชีวิตจริง


ค่า ผิดปกติ คือจุดข้อมูลที่อยู่ห่างจากค่าอื่นๆ ในชุดข้อมูลอย่างผิดปกติ

เรามักจะกำหนดจุดข้อมูลเป็นค่าผิดปกติหากเป็น 1.5 เท่าของช่วงระหว่างควอร์ไทล์เหนือควอไทล์ที่ 3 หรือ 1.5 เท่าของช่วงระหว่างควอไทล์ที่ต่ำกว่าควอไทล์แรกของชุดข้อมูล

หมายเหตุ : ช่วงระหว่างควอไทล์คือความแตกต่างระหว่างควอไทล์ที่สาม (เปอร์เซ็นไทล์ที่ 75) และควอร์ไทล์ที่หนึ่ง (เปอร์เซ็นไทล์ที่ 25) ของชุดข้อมูล

สถานการณ์ต่อไปนี้แสดงตัวอย่างค่าผิดปกติในสถานการณ์จริง

ตัวอย่างที่ 1: ค่าผิดปกติของรายได้

สถานการณ์ที่เป็นรูปธรรมซึ่งค่าผิดปกติมักปรากฏขึ้นคือการกระจายรายได้

ตัวอย่างเช่น เปอร์เซ็นไทล์ที่ 25 (Q1) ของรายได้ต่อปีในบางประเทศอาจเป็น 15,000 ดอลลาร์สหรัฐฯ ต่อปี และเปอร์เซ็นไทล์ที่ 75 (ไตรมาส 3) อาจเป็น 120,000 ดอลลาร์ต่อปี

ช่วงระหว่างควอไทล์ (IQR) จะถูกคำนวณดังนี้: 120,000 ดอลลาร์ – 15,000 ดอลลาร์ = 105,000 ดอลลาร์

ซึ่งหมายความว่าใครก็ตามที่มีรายได้เกินขีดจำกัดต่อไปนี้จะถือเป็นค่าผิดปกติ:

  • ขีดจำกัดล่าง : ไตรมาสที่ 1 – 1.5*IQR = $15,000 – 1.5*$105,000 = -$142,500
  • ขีดจำกัดบน : ไตรมาส 3 + 1.5*IQR = 120,000 ดอลลาร์ + 1.5*105,000 ดอลลาร์ = 277,500 ดอลลาร์

คนอย่าง Elon Musk ซึ่งมีมูลค่าสุทธิเป็นล้านล้านดอลลาร์ จะได้รับการพิจารณาว่าเป็นรายได้ที่สูงกว่าปกติในแง่ของรายได้ต่อปี

หมายเหตุ : ค่าของค่าผิดปกติที่เกินขีดจำกัดล่างอาจไม่มีความหมายเสมอไป เช่น ไม่สามารถหารายได้ต่อปีติดลบได้

ตัวอย่างที่ 2: ค่าผิดปกติของภาวะหยุดหายใจขณะหลับ

อีกสถานการณ์ในโลกแห่งความเป็นจริงที่ค่าผิดปกติมักปรากฏอยู่ในภาวะหยุดหายใจขณะหลับ

ตัวอย่างเช่น เปอร์เซ็นไทล์ที่ 25 (Q1) ของระยะเวลาที่บุคคลสามารถกลั้นหายใจได้คือประมาณ 15 วินาที ในขณะที่เปอร์เซ็นไทล์ที่ 75 (Q3) คือประมาณ 75 วินาที

ช่วงระหว่างควอไทล์ (IQR) จะถูกคำนวณดังนี้ 75 – 15 = 60

ซึ่งหมายความว่าใครก็ตามที่สามารถกลั้นหายใจได้นอกเหนือขีดจำกัดต่อไปนี้จะถือว่าผิดปกติ:

  • ขีดจำกัดล่าง : Q1 – 1.5*IQR = 15 – 1.5*60 = -75 วินาที
  • ขีดจำกัดบน : Q3 + 1.5*IQR = 75 + 1.5*60 = 165 วินาที

นักดำน้ำแบบฟรีไดฟ์ ทุกคนที่สามารถกลั้นหายใจได้ตั้งแต่ 10 นาทีขึ้นไปจะถือว่าผิดปกติเพราะสามารถกลั้นหายใจได้นานกว่า 165 วินาทีมาก

ตัวอย่างที่ 3: ค่าผิดปกติของขนาดสัตว์

สถานการณ์ในโลกแห่งความเป็นจริงอีกสถานการณ์หนึ่งที่ค่าผิดปกติมักปรากฏขึ้นคือขนาดของสัตว์

ตัวอย่างเช่น เปอร์เซ็นไทล์ที่ 25 (Q1) ของความสูงของม้าจะอยู่ที่ประมาณ 5 ฟุต และเปอร์เซ็นไทล์ที่ 75 (Q3) อยู่ที่ประมาณ 5.5 ฟุต

ช่วงระหว่างควอไทล์ (IQR) จะคำนวณได้ดังนี้ 5.5 – 5 = 0.5 ฟุต

ซึ่งหมายความว่าม้าตัวใดก็ตามที่มีขนาดเกินขีดจำกัดต่อไปนี้จะถือเป็นค่าผิดปกติ:

  • ขีดจำกัดล่าง : Q1 – 1.5*IQR = 5 – 1.5*0.5 = 4.25 ฟุต
  • ขีดจำกัดบน : Q3 + 1.5*IQR = 5 + 1.5*0.5 = 5.75 ฟุต

จากข้อมูลของ Guinness World Records สถิติของม้าที่สูงที่สุดตลอดกาลอยู่ที่เพียง 7 ฟุตเท่านั้น เนื่องจากความสูงนี้สูงกว่าขีดจำกัดบนที่ 5.75 ฟุต ม้าตัวนี้จึงถือว่าผิดปกติอย่างชัดเจน

ตัวอย่างที่ 4: ค่าผิดปกติในการขายตั๋วภาพยนตร์

สถานการณ์ในโลกแห่งความเป็นจริงอีกสถานการณ์หนึ่งที่ความผิดปกติมักปรากฏอยู่ในการขายตั๋วภาพยนตร์

ตัวอย่างเช่น เปอร์เซ็นไทล์ที่ 25 (Q1) ของยอดขายตั๋วภาพยนตร์รวมอยู่ที่ประมาณ 2 ล้านดอลลาร์ และเปอร์เซ็นไทล์ที่ 75 (Q3) อยู่ที่ประมาณ 15 ล้านดอลลาร์

ช่วงระหว่างควอไทล์ (IQR) จะคำนวณดังนี้: 15 ล้านเหรียญสหรัฐ – 2 ล้านเหรียญสหรัฐ = 13 ล้านเหรียญสหรัฐ

ซึ่งหมายความว่าภาพยนตร์ใดๆ ที่มียอดขายรวมเกินขีดจำกัดต่อไปนี้จะถือเป็นค่าผิดปกติ:

  • ขีดจำกัดล่าง : T1 – 1.5*IQR = 2 ล้านดอลลาร์ – 1.5*13 ล้านดอลลาร์ = -17.5 ล้านดอลลาร์
  • ขีดจำกัดบน : T3 + 1.5*IQR = 15 ล้านดอลลาร์ + 1.5*13 ล้านดอลลาร์ = 34.5 ล้านดอลลาร์

ภาพยนตร์ Star Wars ส่วนใหญ่ทำรายได้ได้มากกว่า 34.5 ล้านเหรียญสหรัฐ ซึ่งทำให้มียอดขายตั๋วที่ผิดปกติ

ตัวอย่างที่ 5: ค่าผิดปกติของคะแนนต่อเกม

อีกด้านในโลกแห่งความเป็นจริงที่ความผิดปกติมักปรากฏคือกีฬาอาชีพ

ตัวอย่างเช่น เปอร์เซ็นไทล์ที่ 25 (Q1) ของคะแนนที่ผู้เล่น NBA ทำได้คือประมาณ 5 แต้มต่อเกม และเปอร์เซ็นไทล์ที่ 75 (Q3) คือประมาณ 15 แต้มต่อเกม

ช่วงระหว่างควอไทล์ (IQR) จะคำนวณได้ดังนี้ 15 – 5 = 10 จุด

ซึ่งหมายความว่าผู้เล่นคนใดก็ตามที่มีค่าเฉลี่ยอยู่นอกขีดจำกัดต่อไปนี้จะถือว่าเป็นค่าผิดปกติ:

  • ขีดจำกัดล่าง : Q1 – 1.5*IQR = 5 – 1.5*10 = -10 จุด
  • ขีดจำกัดบน : Q3 + 1.5*IQR = 15 + 1.5*10 = 30 จุด

ใน หลายฤดูกาลของ NBA ผู้เล่นที่ทำคะแนนสูงสุดมักจะทำคะแนนได้มากกว่า 30 แต้มต่อเกม ทำให้เขากลายเป็นผู้เล่นที่แตกต่างจากปกติ

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีค้นหาค่าผิดปกติในชุดข้อมูลโดยใช้ซอฟต์แวร์ทางสถิติต่างๆ:

วิธีค้นหาค่าผิดปกติใน Excel
วิธีค้นหาค่าผิดปกติใน R
วิธีค้นหาค่าผิดปกติใน Python
วิธีค้นหาค่าผิดปกติใน SPSS

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *