วิธีเรียกใช้เครื่องทดสอบของ grubbs ใน excel
การทดสอบกรับส์ เป็นการทดสอบทางสถิติที่สามารถใช้เพื่อระบุการมีอยู่ของค่าผิดปกติในชุดข้อมูล หากต้องการใช้การทดสอบนี้ ชุดข้อมูลที่คุณกำลังวิเคราะห์จะต้องมีการแจกแจงแบบปกติโดยประมาณ และโดยหลักการแล้ว จะต้องมีข้อสังเกตอย่างน้อย 7 รายการ
หมายเหตุ: หากคุณคิดว่าชุดข้อมูลมีค่าผิดปกติหลายค่า คุณควรใช้ การทดสอบช่องว่างนักเรียนระดับสูงสุดทั่วไปสำหรับค่าผิดปกติ แทน
หากคุณเชื่อว่าค่าสูงสุดในชุดข้อมูลเป็นค่าผิดปกติ สถิติการทดสอบจะถูกคำนวณดังนี้:
G = (x สูงสุด – x ) / วินาที
หากคุณเชื่อว่าค่าต่ำสุดในชุดข้อมูลเป็นค่าผิดปกติ สถิติการทดสอบจะถูกคำนวณดังนี้:
G = ( x – x นาที ) / วินาที
และหากคุณไม่แน่ใจว่าค่าสูงสุดหรือค่าต่ำสุดของชุดข้อมูลนั้นมีค่าผิดปกติหรือไม่ และคุณต้องการทดสอบแบบสองด้าน สถิติการทดสอบจะถูกคำนวณดังนี้:
G = สูงสุด|x ผม – x | /วิ
โดยที่ x คือค่าเฉลี่ยตัวอย่าง และ s คือค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง
ค่าวิกฤตของการทดสอบคำนวณดังนี้:
G วิกฤต = (n-1)t วิกฤต / √[n(n-2 + t 2 วิกฤต )]
โดยที่ t วิกฤต คือค่าวิกฤติของการแจกแจง t โดยมีดีกรีอิสระ n-2 และระดับนัยสำคัญคือ α/n สำหรับการทดสอบด้านเดียวและ α/(2n) สำหรับการทดสอบสองด้าน
ตัวอย่าง: การทดสอบ Grubbs ใน Excel
พิจารณาว่าค่า 60 มีค่าผิดปกติในชุดข้อมูลต่อไปนี้หรือไม่:
ขั้นตอนที่ 1: ขั้นแรก เราต้องแน่ใจว่าข้อมูลมีการกระจายโดยประมาณตามปกติ ในการทำเช่นนี้ เราสามารถสร้างฮิสโตแกรมเพื่อตรวจสอบว่าการกระจายตัวนั้นมีรูปทรงระฆังโดยประมาณ ภาพหน้าจอต่อไปนี้แสดงวิธีสร้างฮิสโตแกรมใน Excel โดยใช้ Data Analysis ToolPak :
จากฮิสโตแกรมเราจะเห็นว่าข้อมูลมีการกระจายแบบปกติโดยประมาณ ซึ่งหมายความว่าเราสามารถทำการทดสอบ Grubbs ได้
ขั้นตอนที่ 2: ต่อไป เราจะทำการทดสอบ Grubbs เพื่อตรวจสอบว่าค่า 60 นั้นเป็นค่าผิดปกติในชุดข้อมูลหรือไม่ ภาพหน้าจอด้านล่างแสดงสูตรที่จะใช้ในการทดสอบ Grubbs:
สถิติการทดสอบ G ในเซลล์ D4 คือ 3.603219
ค่าวิกฤต G Critical ในเซลล์ D11 คือ 2.556581 เนื่องจากสถิติการทดสอบมากกว่าค่าวิกฤต ซึ่งหมายความว่าค่า 60 ถือเป็นค่าผิดปกติในชุดข้อมูลนี้
จะทำอย่างไรถ้ามีการระบุค่าผิดปกติ
หากการทดสอบ Grubbs ระบุค่าผิดปกติในชุดข้อมูลของคุณ คุณมีหลายทางเลือก:
- ตรวจสอบอีกครั้งเพื่อให้แน่ใจว่าค่าไม่ใช่การพิมพ์ผิดหรือข้อผิดพลาดในการป้อนข้อมูล บางครั้งค่าที่ปรากฏเป็นค่าผิดปกติในชุดข้อมูลเป็นเพียงการพิมพ์ผิดโดยบุคคลในระหว่างการป้อนข้อมูล ย้อนกลับและตรวจสอบว่าป้อนค่าอย่างถูกต้องก่อนตัดสินใจเพิ่มเติม
- กำหนดค่าใหม่ให้กับค่าผิดปกติ หากค่าผิดปกติเป็นผลมาจากการพิมพ์ผิดหรือข้อผิดพลาดในการป้อนข้อมูล คุณสามารถตัดสินใจกำหนดค่าใหม่ให้กับค่าดังกล่าวได้ เช่น ค่าเฉลี่ยหรือค่ามัธยฐาน ของชุดข้อมูล
- ลบค่าผิดปกติออก หากค่านั้นเป็นค่าผิดปกติจริงๆ คุณสามารถเลือกที่จะลบค่านั้นออกได้หากจะมีผลกระทบสำคัญต่อการวิเคราะห์โดยรวมของคุณ
ไม่ว่าคุณจะตัดสินใจทำอะไรกับค่าผิดปกติ อย่าลืมคำนึงถึงสิ่งนี้เมื่อนำเสนอข้อสรุปสุดท้ายของการวิเคราะห์ของคุณ