คะแนน z ที่แก้ไขคืออะไร? (คำจำกัดความ & #038; ตัวอย่าง)


ในสถิติ คะแนน z บอกเราว่าค่าหนึ่งๆ มาจาก ค่าเฉลี่ย เป็นจำนวนเท่าใด เราใช้สูตรต่อไปนี้เพื่อคำนวณคะแนน z:

คะแนน Z = (x i – μ) / σ

ทอง:

  • x i : ค่าข้อมูลเดียว
  • μ: ค่าเฉลี่ยของชุดข้อมูล
  • σ: ค่าเบี่ยงเบนมาตรฐานของชุดข้อมูล

คะแนน Z มักใช้เพื่อตรวจจับค่าผิดปกติในชุดข้อมูล ตัวอย่างเช่น การสังเกตที่มีคะแนน z น้อยกว่า -3 หรือมากกว่า 3 มักถูกพิจารณาว่ามีค่าผิดปกติ

อย่างไรก็ตาม คะแนน z อาจได้รับผลกระทบจากค่าข้อมูลที่มีขนาดใหญ่หรือเล็กผิดปกติ นี่คือเหตุผลว่าทำไมวิธีที่มีประสิทธิภาพมากขึ้นในการตรวจจับค่าผิดปกติคือการใช้ คะแนน z ที่แก้ไขแล้ว ซึ่งคำนวณได้ดังนี้:

คะแนน z ที่แก้ไข = 0.6745 (x i – x̃) / MAD

ทอง:

  • x i : ค่าข้อมูลเดียว
  • x̃: ค่ามัธยฐานของชุดข้อมูล
  • MAD: ค่ามัธยฐานส่วนเบี่ยงเบนสัมบูรณ์ของชุดข้อมูล

คะแนนมาตรฐานที่แก้ไขแล้วจะมีความเสถียรมากกว่า เนื่องจากใช้ค่ามัธยฐานในการคำนวณคะแนนมาตรฐาน ซึ่งตรงข้ามกับค่าเฉลี่ย ซึ่งทราบกันว่าได้รับอิทธิพลจากค่าผิดปกติ

Iglewicz และ Hoaglin แนะนำว่าค่าที่มีคะแนน z ที่แก้ไขน้อยกว่า -3.5 หรือมากกว่า 3.5 จะถูกระบุว่าเป็นค่าผิดปกติที่อาจเกิดขึ้น

ตัวอย่างทีละขั้นตอนต่อไปนี้แสดงวิธีคำนวณคะแนน z ที่แก้ไขสำหรับชุดข้อมูลที่ระบุ

ขั้นตอนที่ 1: สร้างข้อมูล

สมมติว่าเรามีชุดข้อมูลต่อไปนี้ซึ่งมี 16 ค่า:

ขั้นตอนที่ 2: ค้นหาค่ามัธยฐาน

ต่อไปเราจะหาค่ามัธยฐาน นี่แสดงถึงจุดกึ่งกลางของชุดข้อมูล ซึ่งกลายเป็น 16

ขั้นตอนที่ 3: ค้นหาความแตกต่างสัมบูรณ์ระหว่างแต่ละค่ากับค่ามัธยฐาน

ต่อไป เราจะค้นหาความแตกต่างสัมบูรณ์ระหว่างค่าข้อมูลแต่ละค่ากับค่ามัธยฐาน ตัวอย่างเช่น ผลต่างสัมบูรณ์ระหว่างค่าข้อมูลแรกและค่ามัธยฐานจะถูกคำนวณดังนี้:

ผลต่างสัมบูรณ์ = |6 – 16| = 10

เราสามารถใช้สูตรเดียวกันในการคำนวณความแตกต่างสัมบูรณ์ระหว่างค่าข้อมูลแต่ละค่าและค่ามัธยฐาน:

ขั้นตอนที่ 4: ค้นหาค่าเบี่ยงเบนมัธยฐานสัมบูรณ์

ต่อไป เราจะหาค่าเบี่ยงเบนมัธยฐานสัมบูรณ์ นี่คือค่ามัธยฐานของคอลัมน์ที่สอง ซึ่งกลายเป็น 8

ขั้นตอนที่ 5: ค้นหาคะแนน Z ที่แก้ไขแล้วสำหรับค่าข้อมูลแต่ละค่า

สุดท้ายนี้ เราสามารถคำนวณคะแนน z ที่แก้ไขแล้วสำหรับค่าข้อมูลแต่ละค่าได้โดยใช้สูตรต่อไปนี้:

คะแนน z ที่แก้ไข = 0.6745 (x i – x̃) / MAD

ตัวอย่างเช่น คะแนน z ที่แก้ไขแล้วสำหรับค่าข้อมูลแรกจะถูกคำนวณดังนี้:

คะแนน z ที่แก้ไขแล้ว = 0.6745*(6-16) / 8 = -0.843

เราสามารถทำซ้ำสูตรนี้สำหรับแต่ละค่าในชุดข้อมูล:

เราจะเห็นว่าไม่มีค่าใดในชุดข้อมูลที่มีคะแนน z ที่แก้ไขน้อยกว่า -3.5 หรือมากกว่า 3.5 ดังนั้นเราจึงไม่ได้ติดป้ายกำกับค่าใดๆ ในชุดข้อมูลนี้ว่าเป็นค่าผิดปกติที่อาจเกิดขึ้น

วิธีจัดการกับค่าผิดปกติ

หากมีค่าผิดปกติอยู่ในชุดข้อมูลของคุณ คุณจะมีหลายตัวเลือก:

  • ตรวจสอบให้แน่ใจว่าค่าผิดปกติไม่ได้เป็นผลมาจากข้อผิดพลาดในการป้อนข้อมูล บางครั้งบุคคลเพียงแต่กรอกค่าข้อมูลที่ไม่ถูกต้องในขณะที่บันทึกข้อมูล หากมีค่าผิดปกติ ให้ตรวจสอบก่อนว่าค่าที่ป้อนถูกต้องและไม่ใช่ข้อผิดพลาด
  • กำหนดค่าใหม่ให้กับค่าผิดปกติ หากค่าผิดปกติกลายเป็นผลลัพธ์ของข้อผิดพลาดในการป้อนข้อมูล คุณสามารถตัดสินใจกำหนดค่าใหม่ให้กับค่าดังกล่าวได้ เช่น ค่าเฉลี่ยหรือค่ามัธยฐาน ของชุดข้อมูล
  • ลบค่าผิดปกติออก หากค่านั้นเป็นค่าผิดปกติจริงๆ คุณสามารถเลือกที่จะลบค่านั้นออกได้หากจะมีผลกระทบสำคัญต่อการวิเคราะห์โดยรวมของคุณ เพียงอย่าลืมพูดถึงในรายงานหรือการวิเคราะห์ขั้นสุดท้ายของคุณว่าคุณได้ลบค่าผิดปกติออก

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *