كيفية حساب فترات الثقة في بايثون


فاصل الثقة للمتوسط هو نطاق من القيم التي من المحتمل أن تحتوي على متوسط سكاني بمستوى معين من الثقة.

يتم حسابه على النحو التالي:

فاصل الثقة = x +/- t*(s/√n)

ذهب:

  • x : وسائل العينة
  • t: قيمة t التي تتوافق مع مستوى الثقة
  • s: عينة الانحراف المعياري
  • ن: حجم العينة

يشرح هذا البرنامج التعليمي كيفية حساب فترات الثقة في بايثون.

فترات الثقة باستخدام توزيع t

إذا كنا نعمل مع عينة صغيرة (n < 30)، فيمكننا استخدام الدالة t.interval() من مكتبة scipy.stats لحساب فاصل الثقة لمتوسط المحتوى.

يوضح المثال التالي كيفية حساب فاصل الثقة لمتوسط ارتفاع السكان الحقيقي (بالبوصة) لنوع نباتي معين، باستخدام عينة مكونة من 15 نباتًا:

 import numpy as np
import scipy.stats as st

#define sample data
data = [12, 12, 13, 13, 15, 16, 17, 22, 23, 25, 26, 27, 28, 28, 29]

#create 95% confidence interval for population mean weight
st.t.interval(alpha=0.95, df=len(data)-1, loc=np.mean(data), scale=st.sem(data)) 

(16.758, 24.042)

فاصل الثقة 95% للمتوسط الحقيقي لحجم السكان هو (16.758، 24.042) .

ستلاحظ أنه كلما ارتفع مستوى الثقة، كلما اتسعت فترة الثقة. على سبيل المثال، إليك كيفية حساب فترة ثقة 99% لنفس البيانات بالضبط:

 #create 99% confidence interval for same sample
st.t.interval(alpha= 0.99 , df=len(data)-1, loc=np.mean(data), scale=st.sem(data)) 

(15.348, 25.455)

فاصل الثقة 99% للمتوسط الحقيقي لحجم السكان هو (15.348، 25.455) . لاحظ أن هذا الفاصل الزمني أوسع من فاصل الثقة السابق بنسبة 95%.

فترات الثقة باستخدام التوزيع الطبيعي

إذا كنا نعمل مع عينات أكبر (n≥30)، فيمكننا أن نفترض أن توزيع العينات لمتوسط العينة يتم توزيعه بشكل طبيعي (بفضل نظرية الحد المركزي ) ويمكننا بدلاً من ذلك استخدام الدالة المعيارية. الفاصل الزمني () من مكتبة scipy .stats.

يوضح المثال التالي كيفية حساب فاصل الثقة لمتوسط ارتفاع السكان الحقيقي (بالبوصة) لنوع نباتي معين، باستخدام عينة مكونة من 50 نباتًا:

 import numpy as np
import scipy.stats as st

#define sample data
np.random.seed(0)
data = np.random.randint(10, 30, 50)

#create 95% confidence interval for population mean weight
st.norm.interval(alpha=0.95, loc=np.mean(data), scale=st.sem(data))

(17.40, 21.08)

فاصل الثقة 95% للمتوسط الحقيقي لحجم السكان هو (17.40، 21.08) .

وكما هو الحال مع توزيع t، فإن مستويات الثقة الأعلى تؤدي إلى فترات ثقة أوسع. على سبيل المثال، إليك كيفية حساب فترة ثقة 99% لنفس البيانات بالضبط:

 #create 99% confidence interval for same sample
st.norm.interval(alpha= 0.99 , loc=np.mean(data), scale=st.sem(data))

(16.82, 21.66)

فاصل الثقة 95% للمتوسط الحقيقي لحجم السكان هو (17.82، 21.66) .

كيفية تفسير فترات الثقة

افترض أن فترة الثقة 95% لمتوسط الارتفاع الحقيقي لنوع نباتي هي:

فاصل الثقة 95% = (16.758، 24.042)

طريقة تفسير فترة الثقة هذه هي كما يلي:

هناك احتمال بنسبة 95% أن يحتوي نطاق الثقة [16.758، 24.042] على متوسط ارتفاع النبات الحقيقي للمجموعة.

هناك طريقة أخرى لقول الشيء نفسه وهي أن هناك فرصة بنسبة 5% فقط أن يقع متوسط عدد السكان الحقيقي خارج فترة الثقة البالغة 95%. أي أن هناك احتمال بنسبة 5% فقط أن يكون متوسط ارتفاع النبات الفعلي أقل من 16.758 بوصة أو أكثر من 24.042 بوصة.

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *