วิธีการคำนวณช่วงความเชื่อมั่นทวินามใน python


ช่วงความเชื่อมั่นสำหรับความน่าจะเป็นแบบทวินาม คำนวณโดยใช้สูตรต่อไปนี้:

ช่วงความเชื่อมั่น = p +/- z*(√ p(1-p) / n )

ทอง:

  • p: สัดส่วนของ “ความสำเร็จ”
  • z: ค่า z ที่เลือก
  • n: ขนาดตัวอย่าง

วิธีที่ง่ายที่สุดในการคำนวณช่วงความมั่นใจประเภทนี้ใน Python คือการใช้ฟังก์ชัน สัดส่วน_confint() จากแพ็คเกจ statsmodels :

 proportion_confint ( count , nobs , alpha = 0.05 , method = ' normal ' )

ทอง:

  • count : จำนวนความสำเร็จ
  • nobs : จำนวนความพยายามทั้งหมด
  • อัลฟ่า : ระดับนัยสำคัญ (ค่าเริ่มต้นคือ 0.05)
  • method : วิธีใช้สำหรับช่วงความเชื่อมั่น (ค่าเริ่มต้นคือ “ปกติ”)

ตัวอย่างต่อไปนี้แสดงวิธีใช้ฟังก์ชันนี้ในทางปฏิบัติ

ตัวอย่าง: คำนวณช่วงความเชื่อมั่นทวินามใน Python

สมมติว่าเราต้องการประมาณสัดส่วนของผู้อยู่อาศัยในเขตหนึ่งที่สนับสนุนกฎหมายบางข้อ

เราตัดสินใจสุ่มตัวอย่างผู้อยู่อาศัย 100 คน และพบว่า 56 คนในจำนวนนี้เห็นด้วยกับกฎหมาย

เราสามารถใช้ฟังก์ชัน สัดส่วน_confint() เพื่อคำนวณช่วงความเชื่อมั่น 95% สำหรับสัดส่วนที่แท้จริงของผู้อยู่อาศัยที่มีกฎหมายนี้ในทั้งเทศมณฑล:

 from statsmodels. stats . proportion import proportion_confint

#calculate 95% confidence interval with 56 successes in 100 trials
proportion_confint(count= 56 , nobs= 100 )

(0.4627099463758483, 0.6572900536241518)

ช่วงความเชื่อมั่น 95% สำหรับสัดส่วนที่แท้จริงของผู้อยู่อาศัยในเทศมณฑลที่สนับสนุนกฎหมายคือ [.4627, .6573]

ตามค่าเริ่มต้น ฟังก์ชันนี้ใช้การประมาณปกติเชิงเส้นกำกับเพื่อคำนวณช่วงความเชื่อมั่น อย่างไรก็ตาม เราสามารถใช้อาร์กิวเมนต์ method เพื่อใช้วิธีการอื่นได้

ตัวอย่างเช่น ฟังก์ชันเริ่มต้นที่ใช้ในภาษาโปรแกรม R เพื่อคำนวณช่วงความเชื่อมั่นทวินามคือช่วงคะแนน Wilson

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อระบุวิธีการนี้เมื่อคำนวณช่วงความเชื่อมั่นใน Python:

 from statsmodels. stats . proportion import proportion_confint

#calculate 95% confidence interval with 56 successes in 100 trials
proportion_confint(count= 56 , nobs= 100 , method=' wilson ')

(0.4622810465167698, 0.6532797336983921)

ข้อมูลนี้บอกเราว่าช่วงความเชื่อมั่น 95% สำหรับสัดส่วนที่แท้จริงของผู้อยู่อาศัยในเทศมณฑลที่สนับสนุนกฎหมายคือ [.4623, .6533]

ช่วงความเชื่อมั่นนี้แตกต่างเล็กน้อยจากที่คำนวณโดยใช้การประมาณปกติ

โปรดทราบว่าเรายังสามารถปรับค่า อัลฟ่า เพื่อคำนวณช่วงความเชื่อมั่นที่แตกต่างกันได้

ตัวอย่างเช่น เราสามารถตั้งค่าอัลฟ่าเป็น 0.10 เพื่อคำนวณช่วงความเชื่อมั่น 90%:

 from statsmodels. stats . proportion import proportion_confint

#calculate 90% confidence interval with 56 successes in 100 trials
proportion_confint(count= 56 , nobs= 100 , alpha= 0.10 , method=' wilson ')

(0.47783814499647415, 0.6390007285095451)

ข้อมูลนี้บอกเราว่าช่วงความเชื่อมั่น 90% สำหรับสัดส่วนที่แท้จริงของผู้อยู่อาศัยในเคาน์ตีที่สนับสนุนกฎหมายคือ [.4778, .6390]

หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มสำหรับฟังก์ชัน สัดส่วน_confint() ได้ที่นี่

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่นๆ ใน Python:

วิธีการพล็อตช่วงความมั่นใจใน Python
วิธีใช้การแจกแจงแบบทวินามใน Python

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *