วิธีการทดสอบความพอดีของไคสแควร์ใน r
การ ทดสอบความดีพอดีของไคสแควร์ ใช้เพื่อพิจารณาว่าตัวแปรเชิงหมวดหมู่เป็นไปตามการแจกแจงเชิงสมมุติหรือไม่
บทช่วยสอนนี้จะอธิบายวิธีการทดสอบความพอดีของไคสแควร์ใน R
ตัวอย่าง: การทดสอบความดีพอดีของไคสแควร์ใน R
เจ้าของร้านบอกว่ามีลูกค้ามาที่ร้านในจำนวนเท่ากันทุกวันในสัปดาห์ เพื่อทดสอบสมมติฐานนี้ นักวิจัยจะบันทึกจำนวนลูกค้าที่เข้าร้านในสัปดาห์ที่กำหนดและพบสิ่งต่อไปนี้:
- วันจันทร์: ลูกค้า 50 คน
- วันอังคาร: ลูกค้า 60 คน
- วันพุธ: ลูกค้า 40 คน
- พฤหัสบดี: ลูกค้า 47 คน
- วันศุกร์: ลูกค้า 53 คน
ทำตามขั้นตอนต่อไปนี้เพื่อทำการทดสอบความพอดีของไคสแควร์ใน R เพื่อตรวจสอบว่าข้อมูลสอดคล้องกับคำกล่าวอ้างของเจ้าของร้านค้าหรือไม่
ขั้นตอนที่ 1: สร้างข้อมูล
ขั้นแรก เราจะสร้างตารางสองตารางเพื่อรวบรวมความถี่ที่สังเกตได้และสัดส่วนลูกค้าที่คาดหวังในแต่ละวัน:
observed <- c(50, 60, 40, 47, 53)
expected <- c(.2, .2, .2, .2, .2) #must add up to 1
ขั้นตอนที่ 2: ทำการทดสอบความพอดีของไคสแควร์
ต่อไป เราสามารถทำการทดสอบไคสแควร์ได้พอดีโดยใช้ฟังก์ชัน chisq.test() ซึ่งใช้ไวยากรณ์ต่อไปนี้:
chisq.ทดสอบ(x, p)
ทอง:
- x: เวกเตอร์ตัวเลขของความถี่ที่สังเกตได้
- p: เวกเตอร์ตัวเลขของสัดส่วนที่คาดหวัง
รหัสต่อไปนี้แสดงวิธีใช้ฟังก์ชันนี้ในตัวอย่างของเรา:
#perform Chi-Square Goodness of Fit Test
chisq.test(x=observed, p=expected)
Chi-squared test for given probabilities
data: observed
X-squared = 4.36, df = 4, p-value = 0.3595
สถิติการทดสอบไคสแควร์คือ 4.36 และค่า p ที่สอดคล้องกันคือ 0.3595
โปรดทราบว่าค่า p สอดคล้องกับค่าไคสแควร์ที่มีดีกรีอิสระ n-1 (dof) โดยที่ n คือจำนวนหมวดหมู่ต่างๆ ในกรณีนี้ df = 5-1 = 4
คุณสามารถใช้ เครื่องคำนวณไคสแควร์เป็นค่า P เพื่อยืนยันว่าค่า p ที่สอดคล้องกับ X 2 = 4.36 โดยที่ df = 4 คือ 0.35947
โปรดจำไว้ว่าการทดสอบความดีพอดีของไคสแควร์ใช้สมมติฐานว่างและทางเลือกต่อไปนี้:
- H 0 : (สมมติฐานว่าง) ตัวแปรตามหลังการแจกแจงสมมุติ
- H 1 : (สมมติฐานทางเลือก) ตัวแปรไม่เป็นไปตามการแจกแจงสมมุติฐาน
เนื่องจากค่า p (0.35947) ไม่น้อยกว่า 0.05 เราจึงไม่สามารถปฏิเสธสมมติฐานว่างได้ ซึ่งหมายความว่าเราไม่มีหลักฐานเพียงพอที่จะบอกว่าการกระจายตัวของลูกค้าที่แท้จริงนั้นแตกต่างจากที่เจ้าของร้านค้ารายงาน
แหล่งข้อมูลเพิ่มเติม
วิธีการทดสอบความเป็นอิสระของไคสแควร์ใน R
วิธีการคำนวณค่า P ของสถิติไคสแควร์ในหน่วย R
วิธีค้นหาค่าไคสแควร์วิกฤตใน R