G การทดสอบความดีของความพอดี: คำจำกัดความ + ตัวอย่าง


ในสถิติ การทดสอบ G สำหรับความดีของความพอดี นั้นใช้เพื่อพิจารณาว่าตัวแปรเชิงหมวดหมู่เป็นไปตามการแจกแจงเชิงสมมุติหรือไม่

การทดสอบนี้เป็นอีกทางเลือกหนึ่งของ การทดสอบความดีพอดีของไคสแควร์ และมักใช้เมื่อมีค่าผิดปกติในข้อมูล หรือเมื่อข้อมูลที่คุณกำลังดำเนินการมีขนาดใหญ่มาก

G-Test of goodness of fit ใช้สมมติฐานว่างและทางเลือกต่อไปนี้:

  • H 0 : ตัวแปรตามการแจกแจงสมมุติฐาน
  • H A : ตัวแปร ไม่เป็นไปตาม การแจกแจงแบบสมมุติ

สถิติการทดสอบคำนวณดังนี้:

G=2 * Σ[O * ln(O/E)]

ทอง:

  • O: จำนวนที่สังเกตได้ในเซลล์
  • E: จำนวนที่คาดหวังในเซลล์

หากค่า p ที่สอดคล้องกับสถิติการทดสอบต่ำกว่า ระดับนัยสำคัญที่กำหนด คุณสามารถปฏิเสธสมมติฐานว่างและสรุปได้ว่าตัวแปรที่กำลังศึกษาไม่เป็นไปตามการแจกแจงสมมุติฐาน

ตัวอย่างต่อไปนี้แสดงวิธีดำเนินการทดสอบ Goodness-of-Fit G ในทางปฏิบัติ

ตัวอย่าง: G ทดสอบความดีของความพอดี

นักชีววิทยาอ้างว่ามีเต่าสามสายพันธุ์อยู่ในสัดส่วนที่เท่ากันในบางพื้นที่ เพื่อทดสอบข้อกล่าวอ้างนี้ นักวิจัยอิสระจะนับจำนวนชนิดพันธุ์แต่ละชนิดและพบสิ่งต่อไปนี้:

  • สายพันธุ์ A: 80
  • สายพันธุ์ B: 125
  • สายพันธุ์ C: 95

นักวิจัยอิสระสามารถใช้ขั้นตอนต่อไปนี้เพื่อทำการทดสอบ G ความดีของความพอดี เพื่อตรวจสอบว่าข้อมูลที่รวบรวมได้สอดคล้องกับคำกล่าวอ้างของนักชีววิทยาหรือไม่

ขั้นตอนที่ 1: ระบุสมมติฐานว่างและทางเลือก

ผู้วิจัยจะทำการทดสอบความพอดีแบบ G โดยใช้สมมติฐานดังต่อไปนี้

  • H 0 : มีเต่าสามสายพันธุ์อยู่ในสัดส่วนที่เท่ากันในบริเวณนี้
  • H A : เต่าสามสายพันธุ์ ไม่มี สัดส่วนเท่ากันในบริเวณนี้

ขั้นตอนที่ 2: คำนวณสถิติการทดสอบ

สูตรคำนวณสถิติการทดสอบคือ:

G=2 * Σ[O * ln(O/E)]

ในตัวอย่างนี้ มีเต่าที่พบทั้งหมด 300 ตัว หากมีสัดส่วนของแต่ละสายพันธุ์เท่ากัน เราคาดว่าจะพบเต่าแต่ละสายพันธุ์ได้ 100 ตัว ดังนั้นเราจึงสามารถคำนวณสถิติการทดสอบได้ดังนี้

G = 2 * [80*ln(80/100) + 125*ln(125/100) + 95*ln(95/100)] = 10.337

ขั้นตอนที่ 3: คำนวณค่า p ของสถิติการทดสอบ

จาก เครื่องคำนวณไคสแควร์ถึงค่า P ค่า p-value ที่เกี่ยวข้องกับสถิติการทดสอบ 10.337 และ #categories-1 = 3-1 = 2 องศาอิสระคือ 0.005693

เนื่องจากค่า p นี้น้อยกว่า 0.05 ผู้วิจัยจึงปฏิเสธสมมติฐานที่เป็นโมฆะ ซึ่งหมายความว่าเธอมีหลักฐานเพียงพอที่จะบอกว่า ไม่มี สัดส่วนที่เท่ากันของเต่าแต่ละสายพันธุ์ในพื้นที่นั้น

โบนัส: การทดสอบ G เพื่อความพอดีใน R

คุณสามารถใช้ฟังก์ชัน Gtest() จากแพ็คเกจ DescTools เพื่อทำการทดสอบ Goodness-of-Fit G ใน R ได้อย่างรวดเร็ว

รหัสต่อไปนี้แสดงวิธีดำเนินการทดสอบ G สำหรับตัวอย่างก่อนหน้านี้:

 #load the DescTools library
library (DescTools)

#perform the G-test 
GTest(x = c(80, 125, 95), #observed values
      p = c(1/3, 1/3, 1/3), #expected proportions
      correct=" none ")

	Log likelihood ratio (G-test) goodness of fit test

data: c(80, 125, 95)
G = 10.337, X-squared df = 2, p-value = 0.005693

โปรดทราบว่าสถิติการทดสอบ G คือ 10.337 และค่า p ที่สอดคล้องกันคือ 0.005693 เนื่องจากค่า p นี้น้อยกว่า 0.05 เราจึงทิ้งสมมุติฐานว่าง

ซึ่งตรงกับผลลัพธ์ที่เราคำนวณด้วยตนเอง

แหล่งข้อมูลเพิ่มเติม

คุณสามารถใช้เครื่องคำนวณทดสอบ G ที่เหมาะสมนี้เพื่อทำการทดสอบ G สำหรับชุดข้อมูลใดๆ ก็ได้โดยอัตโนมัติ

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *