วิธีการคำนวณช่วงความมั่นใจใน python

โดย ดร.เบนจามิน แอนเดอร์สัน กรกฎาคม 28, 2023 แนะนำ 0 ความคิดเห็น

ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ย คือช่วงของค่าที่น่าจะมีค่าเฉลี่ยประชากรที่มีระดับความเชื่อมั่นในระดับหนึ่ง

มีการคำนวณดังนี้:

ช่วงความเชื่อมั่น = x +/- t*(s/√n)

ทอง:

x : ค่าเฉลี่ยตัวอย่าง
t: ค่า t ซึ่งสอดคล้องกับระดับความเชื่อมั่น
s: ค่าเบี่ยงเบนมาตรฐานตัวอย่าง
n: ขนาดตัวอย่าง

บทช่วยสอนนี้จะอธิบายวิธีคำนวณช่วงความเชื่อมั่นใน Python

ช่วงความเชื่อมั่นโดยใช้การแจกแจงแบบ t

หากเรากำลังทำงานกับกลุ่มตัวอย่างขนาดเล็ก (n < 30) เราสามารถใช้ ฟังก์ชัน t.interval() จากไลบรารี scipy.stats เพื่อคำนวณช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยประชากร

ตัวอย่างต่อไปนี้แสดงวิธีคำนวณช่วงความเชื่อมั่นสำหรับความสูงของประชากรเฉลี่ยที่แท้จริง (หน่วยเป็นนิ้ว) ของพืชบางชนิด โดยใช้ตัวอย่างพืช 15 ชนิด:

 import numpy as np
import scipy.stats as st

#define sample data
data = [12, 12, 13, 13, 15, 16, 17, 22, 23, 25, 26, 27, 28, 28, 29]

#create 95% confidence interval for population mean weight
st.t.interval(alpha=0.95, df=len(data)-1, loc=np.mean(data), scale=st.sem(data)) 

(16.758, 24.042)

ช่วงความเชื่อมั่น 95% สำหรับขนาดประชากรเฉลี่ยที่แท้จริงคือ (16.758, 24.042)

คุณจะสังเกตได้ว่ายิ่งระดับความเชื่อมั่นสูง ช่วงความเชื่อมั่นก็จะยิ่งกว้างขึ้น ตัวอย่างเช่น ต่อไปนี้เป็นวิธีคำนวณ CI 99% สำหรับข้อมูลเดียวกันทุกประการ:

 #create 99% confidence interval for same sample
st.t.interval(alpha= 0.99 , df=len(data)-1, loc=np.mean(data), scale=st.sem(data)) 

(15.348, 25.455)

ช่วงความเชื่อมั่น 99% สำหรับขนาดประชากรเฉลี่ยที่แท้จริงคือ (15.348, 25.455) โปรดทราบว่าช่วงนี้กว้างกว่าช่วงความเชื่อมั่น 95% ก่อนหน้า

ช่วงความเชื่อมั่นโดยใช้การแจกแจงแบบปกติ

หากเรากำลังทำงานกับตัวอย่างที่มีขนาดใหญ่กว่า (n≥30) เราสามารถสรุปได้ว่าการกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างนั้นมีการแจกแจงแบบปกติ (ต้องขอบคุณ ทฤษฎีบทขีดจำกัดกลาง ) และสามารถใช้ ฟังก์ชันบรรทัดฐาน แทนได้ Interval() จากไลบรารี scipy .stats

ตัวอย่างต่อไปนี้แสดงวิธีคำนวณช่วงความเชื่อมั่นสำหรับความสูงของประชากรเฉลี่ยที่แท้จริง (หน่วยเป็นนิ้ว) ของพืชบางชนิด โดยใช้ตัวอย่างพืช 50 ชนิด:

 import numpy as np
import scipy.stats as st

#define sample data
np.random.seed(0)
data = np.random.randint(10, 30, 50)

#create 95% confidence interval for population mean weight
st.norm.interval(alpha=0.95, loc=np.mean(data), scale=st.sem(data))

(17.40, 21.08)

ช่วงความเชื่อมั่น 95% สำหรับขนาดประชากรเฉลี่ยที่แท้จริงคือ (17.40, 21.08)

และเช่นเดียวกับการแจกแจงแบบ t ระดับความเชื่อมั่นที่สูงขึ้นจะนำไปสู่ช่วงความเชื่อมั่นที่กว้างขึ้น ตัวอย่างเช่น ต่อไปนี้เป็นวิธีคำนวณ CI 99% สำหรับข้อมูลเดียวกันทุกประการ:

 #create 99% confidence interval for same sample
st.norm.interval(alpha= 0.99 , loc=np.mean(data), scale=st.sem(data))

(16.82, 21.66)

ช่วงความเชื่อมั่น 95% สำหรับขนาดประชากรเฉลี่ยที่แท้จริงคือ (17.82, 21.66)

วิธีการตีความช่วงความเชื่อมั่น

สมมติว่าช่วงความมั่นใจ 95% ของเราสำหรับความสูงเฉลี่ยที่แท้จริงของพันธุ์พืชคือ:

ช่วงความเชื่อมั่น 95% = (16.758, 24.042)

วิธีการตีความช่วงความมั่นใจนี้มีดังต่อไปนี้:

มีโอกาส 95% ที่ช่วงความเชื่อมั่นของ [16.758, 24.042] จะมีความสูงของพืชเฉลี่ยที่แท้จริงของประชากร

วิธีพูดแบบเดียวกันอีกวิธีหนึ่งคือ มีโอกาสเพียง 5% ที่ค่าเฉลี่ยประชากรที่แท้จริงจะอยู่นอกช่วงความเชื่อมั่น 95% นั่นคือมีโอกาสเพียง 5% เท่านั้นที่ความสูงของพืชโดยเฉลี่ยจริงจะน้อยกว่า 16.758 นิ้วหรือมากกว่า 24.042 นิ้ว

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

สวัสดี ฉันชื่อเบนจามิน ศาสตราจารย์สถิติเกษียณอายุแล้ว และผันตัวมาเป็นครูสอนสถิติโดยเฉพาะ ด้วยประสบการณ์และความเชี่ยวชาญที่กว้างขวางในสาขาสถิติ ฉันกระตือรือร้นที่จะแบ่งปันความรู้ของฉันเพื่อเสริมศักยภาพนักเรียนผ่าน Statorials. รู้เพิ่มเติม

ช่วงความเชื่อมั่นโดยใช้การแจกแจงแบบ t

ช่วงความเชื่อมั่นโดยใช้การแจกแจงแบบปกติ

วิธีการตีความช่วงความเชื่อมั่น

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

เพิ่มความคิดเห็น