كيفية حساب فاصل الثقة لمعامل الانحدار في r
في نموذج الانحدار الخطي، يخبرنا معامل الانحدار بمتوسط التغير في متغير الاستجابة المرتبط بزيادة وحدة واحدة في متغير التوقع.
يمكننا استخدام الصيغة التالية لحساب فاصل الثقة لمعامل الانحدار:
فاصل الثقة لـ β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
ذهب:
- ب 1 = معامل الانحدار المبين في جدول الانحدار
- t 1-∝/2, n-2 = قيمة t الحرجة لمستوى الثقة 1-∝ مع درجات الحرية n-2 حيث n هو إجمالي عدد الملاحظات في مجموعة البيانات الخاصة بنا
- se(b 1 ) = الخطأ المعياري لـ b 1 الموضح في جدول الانحدار
يوضح المثال التالي كيفية حساب فاصل الثقة لمنحدر الانحدار عمليًا.
مثال: فاصل الثقة لمعامل الانحدار في R
لنفترض أننا نريد ملاءمة نموذج الانحدار الخطي البسيط باستخدام ساعات الدراسة كمتغير متوقع ودرجات الامتحان كمتغير استجابة لـ 15 طالبًا في فصل معين:
يمكننا استخدام الدالة lm() لتناسب نموذج الانحدار الخطي البسيط هذا في R:
#create data frame df <- data. frame (hours=c(1, 2, 4, 5, 5, 6, 6, 7, 8, 10, 11, 11, 12, 12, 14), score=c(64, 66, 76, 73, 74, 81, 83, 82, 80, 88, 84, 82, 91, 93, 89)) #fit linear regression model fit <- lm(score ~ hours, data=df) #view model summary summary(fit) Call: lm(formula = score ~ hours, data = df) Residuals: Min 1Q Median 3Q Max -5,140 -3,219 -1,193 2,816 5,772 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 65,334 2,106 31,023 1.41e-13 *** hours 1.982 0.248 7.995 2.25e-06 *** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.641 on 13 degrees of freedom Multiple R-squared: 0.831, Adjusted R-squared: 0.818 F-statistic: 63.91 on 1 and 13 DF, p-value: 2.253e-06
وباستخدام تقديرات المعاملات في النتيجة يمكننا كتابة نموذج الانحدار الخطي البسيط المجهز كما يلي:
النتيجة = 65.334 + 1.982*(ساعات الدراسة)
لاحظ أن معامل الانحدار للساعات هو 1.982 .
يخبرنا هذا أن كل ساعة إضافية تقضيها في الدراسة ترتبط بمتوسط زيادة قدرها 1,982 في درجة الامتحان.
يمكننا استخدام الدالة confint() لحساب فاصل ثقة 95% لمعامل الانحدار:
#calculate confidence interval for regression coefficient for 'hours' confint(fit, ' hours ', level= 0.95 ) 2.5% 97.5% hours 1.446682 2.518068
فترة الثقة 95% لمعامل الانحدار هي [1.446, 2.518] .
وبما أن فاصل الثقة هذا لا يحتوي على القيمة 0، فيمكننا أن نستنتج أن هناك علاقة ذات دلالة إحصائية بين ساعات الدراسة ودرجة الامتحان.
يمكننا أيضًا التأكد من صحة ذلك عن طريق الحساب اليدوي لفاصل الثقة 95% لمعامل الانحدار:
- 95% CI لـ β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
- 95% CI لـ β 1 : 1.982 ± t 0.975، 15-2 *0.248
- 95% CI لـ β 1 : 1.982 ± 2.1604*0.248
- 95% CI لـ β 1 : [1.446، 2.518]
فترة الثقة 95% لمعامل الانحدار هي [1.446, 2.518] .
ملاحظة رقم 1 : استخدمنا حاسبة توزيع t العكسية للعثور على قيمة t الحرجة التي تتوافق مع مستوى ثقة 95% مع 13 درجة حرية.
ملاحظة رقم 2 : لحساب فاصل ثقة بمستوى ثقة مختلف، ما عليك سوى تغيير قيمة وسيطة المستوى في الدالة confint() .
مصادر إضافية
توفر البرامج التعليمية التالية معلومات إضافية حول الانحدار الخطي في R:
كيفية تفسير مخرجات الانحدار في R
كيفية إجراء الانحدار الخطي البسيط في R
كيفية إجراء الانحدار الخطي المتعدد في R
كيفية إجراء الانحدار اللوجستي في R