G การทดสอบความดีของความพอดี: คำจำกัดความ + ตัวอย่าง
ในสถิติ การทดสอบ G สำหรับความดีของความพอดี นั้นใช้เพื่อพิจารณาว่าตัวแปรเชิงหมวดหมู่เป็นไปตามการแจกแจงเชิงสมมุติหรือไม่
การทดสอบนี้เป็นอีกทางเลือกหนึ่งของ การทดสอบความดีพอดีของไคสแควร์ และมักใช้เมื่อมีค่าผิดปกติในข้อมูล หรือเมื่อข้อมูลที่คุณกำลังดำเนินการมีขนาดใหญ่มาก
G-Test of goodness of fit ใช้สมมติฐานว่างและทางเลือกต่อไปนี้:
- H 0 : ตัวแปรตามการแจกแจงสมมุติฐาน
- H A : ตัวแปร ไม่เป็นไปตาม การแจกแจงแบบสมมุติ
สถิติการทดสอบคำนวณดังนี้:
G=2 * Σ[O * ln(O/E)]
ทอง:
- O: จำนวนที่สังเกตได้ในเซลล์
- E: จำนวนที่คาดหวังในเซลล์
หากค่า p ที่สอดคล้องกับสถิติการทดสอบต่ำกว่า ระดับนัยสำคัญที่กำหนด คุณสามารถปฏิเสธสมมติฐานว่างและสรุปได้ว่าตัวแปรที่กำลังศึกษาไม่เป็นไปตามการแจกแจงสมมุติฐาน
ตัวอย่างต่อไปนี้แสดงวิธีดำเนินการทดสอบ Goodness-of-Fit G ในทางปฏิบัติ
ตัวอย่าง: G ทดสอบความดีของความพอดี
นักชีววิทยาอ้างว่ามีเต่าสามสายพันธุ์อยู่ในสัดส่วนที่เท่ากันในบางพื้นที่ เพื่อทดสอบข้อกล่าวอ้างนี้ นักวิจัยอิสระจะนับจำนวนชนิดพันธุ์แต่ละชนิดและพบสิ่งต่อไปนี้:
- สายพันธุ์ A: 80
- สายพันธุ์ B: 125
- สายพันธุ์ C: 95
นักวิจัยอิสระสามารถใช้ขั้นตอนต่อไปนี้เพื่อทำการทดสอบ G ความดีของความพอดี เพื่อตรวจสอบว่าข้อมูลที่รวบรวมได้สอดคล้องกับคำกล่าวอ้างของนักชีววิทยาหรือไม่
ขั้นตอนที่ 1: ระบุสมมติฐานว่างและทางเลือก
ผู้วิจัยจะทำการทดสอบความพอดีแบบ G โดยใช้สมมติฐานดังต่อไปนี้
- H 0 : มีเต่าสามสายพันธุ์อยู่ในสัดส่วนที่เท่ากันในบริเวณนี้
- H A : เต่าสามสายพันธุ์ ไม่มี สัดส่วนเท่ากันในบริเวณนี้
ขั้นตอนที่ 2: คำนวณสถิติการทดสอบ
สูตรคำนวณสถิติการทดสอบคือ:
G=2 * Σ[O * ln(O/E)]
ในตัวอย่างนี้ มีเต่าที่พบทั้งหมด 300 ตัว หากมีสัดส่วนของแต่ละสายพันธุ์เท่ากัน เราคาดว่าจะพบเต่าแต่ละสายพันธุ์ได้ 100 ตัว ดังนั้นเราจึงสามารถคำนวณสถิติการทดสอบได้ดังนี้
G = 2 * [80*ln(80/100) + 125*ln(125/100) + 95*ln(95/100)] = 10.337
ขั้นตอนที่ 3: คำนวณค่า p ของสถิติการทดสอบ
จาก เครื่องคำนวณไคสแควร์ถึงค่า P ค่า p-value ที่เกี่ยวข้องกับสถิติการทดสอบ 10.337 และ #categories-1 = 3-1 = 2 องศาอิสระคือ 0.005693
เนื่องจากค่า p นี้น้อยกว่า 0.05 ผู้วิจัยจึงปฏิเสธสมมติฐานที่เป็นโมฆะ ซึ่งหมายความว่าเธอมีหลักฐานเพียงพอที่จะบอกว่า ไม่มี สัดส่วนที่เท่ากันของเต่าแต่ละสายพันธุ์ในพื้นที่นั้น
โบนัส: การทดสอบ G เพื่อความพอดีใน R
คุณสามารถใช้ฟังก์ชัน Gtest() จากแพ็คเกจ DescTools เพื่อทำการทดสอบ Goodness-of-Fit G ใน R ได้อย่างรวดเร็ว
รหัสต่อไปนี้แสดงวิธีดำเนินการทดสอบ G สำหรับตัวอย่างก่อนหน้านี้:
#load the DescTools library library (DescTools) #perform the G-test GTest(x = c(80, 125, 95), #observed values p = c(1/3, 1/3, 1/3), #expected proportions correct=" none ") Log likelihood ratio (G-test) goodness of fit test data: c(80, 125, 95) G = 10.337, X-squared df = 2, p-value = 0.005693
โปรดทราบว่าสถิติการทดสอบ G คือ 10.337 และค่า p ที่สอดคล้องกันคือ 0.005693 เนื่องจากค่า p นี้น้อยกว่า 0.05 เราจึงทิ้งสมมุติฐานว่าง
ซึ่งตรงกับผลลัพธ์ที่เราคำนวณด้วยตนเอง
แหล่งข้อมูลเพิ่มเติม
คุณสามารถใช้เครื่องคำนวณทดสอบ G ที่เหมาะสมนี้เพื่อทำการทดสอบ G สำหรับชุดข้อมูลใดๆ ก็ได้โดยอัตโนมัติ