วิธีการคำนวณช่วงความเชื่อมั่นทวินามใน python
ช่วงความเชื่อมั่นสำหรับความน่าจะเป็นแบบทวินาม คำนวณโดยใช้สูตรต่อไปนี้:
ช่วงความเชื่อมั่น = p +/- z*(√ p(1-p) / n )
ทอง:
- p: สัดส่วนของ “ความสำเร็จ”
- z: ค่า z ที่เลือก
- n: ขนาดตัวอย่าง
วิธีที่ง่ายที่สุดในการคำนวณช่วงความมั่นใจประเภทนี้ใน Python คือการใช้ฟังก์ชัน สัดส่วน_confint() จากแพ็คเกจ statsmodels :
proportion_confint ( count , nobs , alpha = 0.05 , method = ' normal ' )
ทอง:
- count : จำนวนความสำเร็จ
- nobs : จำนวนความพยายามทั้งหมด
- อัลฟ่า : ระดับนัยสำคัญ (ค่าเริ่มต้นคือ 0.05)
- method : วิธีใช้สำหรับช่วงความเชื่อมั่น (ค่าเริ่มต้นคือ “ปกติ”)
ตัวอย่างต่อไปนี้แสดงวิธีใช้ฟังก์ชันนี้ในทางปฏิบัติ
ตัวอย่าง: คำนวณช่วงความเชื่อมั่นทวินามใน Python
สมมติว่าเราต้องการประมาณสัดส่วนของผู้อยู่อาศัยในเขตหนึ่งที่สนับสนุนกฎหมายบางข้อ
เราตัดสินใจสุ่มตัวอย่างผู้อยู่อาศัย 100 คน และพบว่า 56 คนในจำนวนนี้เห็นด้วยกับกฎหมาย
เราสามารถใช้ฟังก์ชัน สัดส่วน_confint() เพื่อคำนวณช่วงความเชื่อมั่น 95% สำหรับสัดส่วนที่แท้จริงของผู้อยู่อาศัยที่มีกฎหมายนี้ในทั้งเทศมณฑล:
from statsmodels. stats . proportion import proportion_confint #calculate 95% confidence interval with 56 successes in 100 trials proportion_confint(count= 56 , nobs= 100 ) (0.4627099463758483, 0.6572900536241518)
ช่วงความเชื่อมั่น 95% สำหรับสัดส่วนที่แท้จริงของผู้อยู่อาศัยในเทศมณฑลที่สนับสนุนกฎหมายคือ [.4627, .6573]
ตามค่าเริ่มต้น ฟังก์ชันนี้ใช้การประมาณปกติเชิงเส้นกำกับเพื่อคำนวณช่วงความเชื่อมั่น อย่างไรก็ตาม เราสามารถใช้อาร์กิวเมนต์ method เพื่อใช้วิธีการอื่นได้
ตัวอย่างเช่น ฟังก์ชันเริ่มต้นที่ใช้ในภาษาโปรแกรม R เพื่อคำนวณช่วงความเชื่อมั่นทวินามคือช่วงคะแนน Wilson
เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อระบุวิธีการนี้เมื่อคำนวณช่วงความเชื่อมั่นใน Python:
from statsmodels. stats . proportion import proportion_confint #calculate 95% confidence interval with 56 successes in 100 trials proportion_confint(count= 56 , nobs= 100 , method=' wilson ') (0.4622810465167698, 0.6532797336983921)
ข้อมูลนี้บอกเราว่าช่วงความเชื่อมั่น 95% สำหรับสัดส่วนที่แท้จริงของผู้อยู่อาศัยในเทศมณฑลที่สนับสนุนกฎหมายคือ [.4623, .6533]
ช่วงความเชื่อมั่นนี้แตกต่างเล็กน้อยจากที่คำนวณโดยใช้การประมาณปกติ
โปรดทราบว่าเรายังสามารถปรับค่า อัลฟ่า เพื่อคำนวณช่วงความเชื่อมั่นที่แตกต่างกันได้
ตัวอย่างเช่น เราสามารถตั้งค่าอัลฟ่าเป็น 0.10 เพื่อคำนวณช่วงความเชื่อมั่น 90%:
from statsmodels. stats . proportion import proportion_confint #calculate 90% confidence interval with 56 successes in 100 trials proportion_confint(count= 56 , nobs= 100 , alpha= 0.10 , method=' wilson ') (0.47783814499647415, 0.6390007285095451)
ข้อมูลนี้บอกเราว่าช่วงความเชื่อมั่น 90% สำหรับสัดส่วนที่แท้จริงของผู้อยู่อาศัยในเคาน์ตีที่สนับสนุนกฎหมายคือ [.4778, .6390]
หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มสำหรับฟังก์ชัน สัดส่วน_confint() ได้ที่นี่
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่นๆ ใน Python:
วิธีการพล็อตช่วงความมั่นใจใน Python
วิธีใช้การแจกแจงแบบทวินามใน Python