วิธีการทดสอบความเป็นอิสระของ chi-square ใน python
การทดสอบความเป็นอิสระของไคสแคว ร์ ใช้เพื่อกำหนดว่ามีความสัมพันธ์ที่มีนัยสำคัญระหว่างตัวแปรหมวดหมู่สองตัวหรือไม่
บทช่วยสอนนี้จะอธิบายวิธีการทดสอบความเป็นอิสระของไคสแควร์ใน Python
ตัวอย่าง: การทดสอบความเป็นอิสระของไคสแควร์ใน Python
สมมติว่าเราต้องการทราบว่าเพศสัมพันธ์กับการเลือกพรรคการเมืองหรือไม่ เราสุ่มตัวอย่างผู้มีสิทธิเลือกตั้ง 500 คน และถามพวกเขาเกี่ยวกับความชอบพรรคการเมืองของพวกเขา ตารางต่อไปนี้แสดงผลการสำรวจ:
รีพับลิกัน | ประชาธิปัตย์ | เป็นอิสระ | ทั้งหมด | |
ชาย | 120 | 90 | 40 | 250 |
หญิง | 110 | 95 | 45 | 250 |
ทั้งหมด | 230 | 185 | 85 | 500 |
ใช้ขั้นตอนต่อไปนี้เพื่อทำการทดสอบความเป็นอิสระของไคสแควร์ใน Python เพื่อตรวจสอบว่าเพศเกี่ยวข้องกับการตั้งค่าพรรคการเมืองหรือไม่
ขั้นตอนที่ 1: สร้างข้อมูล
ขั้นแรก เราจะสร้างตารางเพื่อเก็บข้อมูลของเรา:
data = [[120, 90, 40], [110, 95, 45]]
ขั้นตอนที่ 2: ทำการทดสอบไคสแควร์เพื่อความเป็นอิสระ
ต่อไป เราสามารถทำการทดสอบความเป็นอิสระของไคสแควร์ได้โดยใช้ ฟังก์ชัน chi2_contingency จากไลบรารี SciPy ซึ่งใช้ไวยากรณ์ต่อไปนี้:
chi2_contingency (สังเกตได้)
ทอง:
- สังเกตได้: ตารางฉุกเฉินของค่าที่สังเกตได้
รหัสต่อไปนี้แสดงวิธีใช้ฟังก์ชันนี้ในตัวอย่างเฉพาะของเรา:
import scipy.stats as stats #perform the Chi-Square Test of Independence stats.chi2_contingency(data) (0.864, 0.649, 2, array([[115. , 92.5, 42.5], [115. , 92.5, 42.5]]))
วิธีการตีความผลลัพธ์มีดังนี้:
- สถิติการทดสอบไคสแควร์: 0.864
- ค่า p: 0.649
- องศาความเป็นอิสระ: 2 (คำนวณเป็น #rows-1 * #columns-1)
- ตาราง: ตารางสุดท้ายแสดงค่าที่คาดหวังสำหรับแต่ละเซลล์ในตารางฉุกเฉิน
โปรดจำไว้ว่า การทดสอบความเป็นอิสระของไคสแควร์ ใช้สมมติฐานว่างและทางเลือกต่อไปนี้:
- H 0 : (สมมติฐานว่าง) ตัวแปรทั้งสองมีความเป็นอิสระต่อกัน
- H 1 : (สมมติฐานทางเลือก) ตัวแปรทั้งสอง ไม่ เป็นอิสระต่อกัน
เนื่องจากค่า p-value (0.649) ของการทดสอบไม่น้อยกว่า 0.05 เราจึงไม่สามารถปฏิเสธสมมติฐานว่างได้ ซึ่งหมายความว่าเราไม่มีหลักฐานเพียงพอที่จะกล่าวว่ามีความสัมพันธ์ระหว่างเพศและการตั้งค่าของพรรคการเมือง
กล่าวอีกนัยหนึ่ง การกำหนดเพศและพรรคการเมืองมีความเป็นอิสระ