วิธีการคำนวณช่วงความมั่นใจใน python
ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ย คือช่วงของค่าที่น่าจะมีค่าเฉลี่ยประชากรที่มีระดับความเชื่อมั่นในระดับหนึ่ง
มีการคำนวณดังนี้:
ช่วงความเชื่อมั่น = x +/- t*(s/√n)
ทอง:
- x : ค่าเฉลี่ยตัวอย่าง
- t: ค่า t ซึ่งสอดคล้องกับระดับความเชื่อมั่น
- s: ค่าเบี่ยงเบนมาตรฐานตัวอย่าง
- n: ขนาดตัวอย่าง
บทช่วยสอนนี้จะอธิบายวิธีคำนวณช่วงความเชื่อมั่นใน Python
ช่วงความเชื่อมั่นโดยใช้การแจกแจงแบบ t
หากเรากำลังทำงานกับกลุ่มตัวอย่างขนาดเล็ก (n < 30) เราสามารถใช้ ฟังก์ชัน t.interval() จากไลบรารี scipy.stats เพื่อคำนวณช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยประชากร
ตัวอย่างต่อไปนี้แสดงวิธีคำนวณช่วงความเชื่อมั่นสำหรับความสูงของประชากรเฉลี่ยที่แท้จริง (หน่วยเป็นนิ้ว) ของพืชบางชนิด โดยใช้ตัวอย่างพืช 15 ชนิด:
import numpy as np import scipy.stats as st #define sample data data = [12, 12, 13, 13, 15, 16, 17, 22, 23, 25, 26, 27, 28, 28, 29] #create 95% confidence interval for population mean weight st.t.interval(alpha=0.95, df=len(data)-1, loc=np.mean(data), scale=st.sem(data)) (16.758, 24.042)
ช่วงความเชื่อมั่น 95% สำหรับขนาดประชากรเฉลี่ยที่แท้จริงคือ (16.758, 24.042)
คุณจะสังเกตได้ว่ายิ่งระดับความเชื่อมั่นสูง ช่วงความเชื่อมั่นก็จะยิ่งกว้างขึ้น ตัวอย่างเช่น ต่อไปนี้เป็นวิธีคำนวณ CI 99% สำหรับข้อมูลเดียวกันทุกประการ:
#create 99% confidence interval for same sample st.t.interval(alpha= 0.99 , df=len(data)-1, loc=np.mean(data), scale=st.sem(data)) (15.348, 25.455)
ช่วงความเชื่อมั่น 99% สำหรับขนาดประชากรเฉลี่ยที่แท้จริงคือ (15.348, 25.455) โปรดทราบว่าช่วงนี้กว้างกว่าช่วงความเชื่อมั่น 95% ก่อนหน้า
ช่วงความเชื่อมั่นโดยใช้การแจกแจงแบบปกติ
หากเรากำลังทำงานกับตัวอย่างที่มีขนาดใหญ่กว่า (n≥30) เราสามารถสรุปได้ว่าการกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างนั้นมีการแจกแจงแบบปกติ (ต้องขอบคุณ ทฤษฎีบทขีดจำกัดกลาง ) และสามารถใช้ ฟังก์ชันบรรทัดฐาน แทนได้ Interval() จากไลบรารี scipy .stats
ตัวอย่างต่อไปนี้แสดงวิธีคำนวณช่วงความเชื่อมั่นสำหรับความสูงของประชากรเฉลี่ยที่แท้จริง (หน่วยเป็นนิ้ว) ของพืชบางชนิด โดยใช้ตัวอย่างพืช 50 ชนิด:
import numpy as np import scipy.stats as st #define sample data np.random.seed(0) data = np.random.randint(10, 30, 50) #create 95% confidence interval for population mean weight st.norm.interval(alpha=0.95, loc=np.mean(data), scale=st.sem(data)) (17.40, 21.08)
ช่วงความเชื่อมั่น 95% สำหรับขนาดประชากรเฉลี่ยที่แท้จริงคือ (17.40, 21.08)
และเช่นเดียวกับการแจกแจงแบบ t ระดับความเชื่อมั่นที่สูงขึ้นจะนำไปสู่ช่วงความเชื่อมั่นที่กว้างขึ้น ตัวอย่างเช่น ต่อไปนี้เป็นวิธีคำนวณ CI 99% สำหรับข้อมูลเดียวกันทุกประการ:
#create 99% confidence interval for same sample st.norm.interval(alpha= 0.99 , loc=np.mean(data), scale=st.sem(data)) (16.82, 21.66)
ช่วงความเชื่อมั่น 95% สำหรับขนาดประชากรเฉลี่ยที่แท้จริงคือ (17.82, 21.66)
วิธีการตีความช่วงความเชื่อมั่น
สมมติว่าช่วงความมั่นใจ 95% ของเราสำหรับความสูงเฉลี่ยที่แท้จริงของพันธุ์พืชคือ:
ช่วงความเชื่อมั่น 95% = (16.758, 24.042)
วิธีการตีความช่วงความมั่นใจนี้มีดังต่อไปนี้:
มีโอกาส 95% ที่ช่วงความเชื่อมั่นของ [16.758, 24.042] จะมีความสูงของพืชเฉลี่ยที่แท้จริงของประชากร
วิธีพูดแบบเดียวกันอีกวิธีหนึ่งคือ มีโอกาสเพียง 5% ที่ค่าเฉลี่ยประชากรที่แท้จริงจะอยู่นอกช่วงความเชื่อมั่น 95% นั่นคือมีโอกาสเพียง 5% เท่านั้นที่ความสูงของพืชโดยเฉลี่ยจริงจะน้อยกว่า 16.758 นิ้วหรือมากกว่า 24.042 นิ้ว