كيفية تفسير pr(>|t|) في إخراج نموذج الانحدار في r
عندما تقوم بإجراء انحدار خطي في R، سيتم عرض مخرجات نموذج الانحدار الخاص بك بالتنسيق التالي:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
يمثل العمود Pr(>|t|) القيمة p المرتبطة بالقيمة الموجودة في عمود القيمة t .
إذا كانت القيمة p أقل من مستوى معين من الأهمية (على سبيل المثال α = 0.05)، فإن متغير التوقع يعتبر أن له علاقة ذات دلالة إحصائية مع متغير الاستجابة في النموذج.
يوضح المثال التالي كيفية تفسير القيم الموجودة في العمود Pr(>|t|) لنموذج انحدار معين.
مثال: كيفية تفسير قيم Pr(>|t|).
لنفترض أننا نريد احتواء نموذج الانحدار الخطي المتعدد باستخدام متغيرات التوقع x1 و x2 ومتغير استجابة واحد y .
يوضح التعليمة البرمجية التالية كيفية إنشاء إطار بيانات وملاءمة نموذج الانحدار مع البيانات:
#create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
x2=c(7, 7, 5, 6, 5, 4, 5, 6),
y=c(8, 8, 9, 9, 13, 14, 17, 14))
#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)
#view model summary
summary(model)
Call:
lm(formula = y ~ x1 + x2, data = df)
Residuals:
1 2 3 4 5 6 7 8
2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208
إليك كيفية تفسير القيم الموجودة في العمود Pr(>|t|):
- القيمة p للمتغير المتوقع x1 هي 0.0325 . وبما أن هذه القيمة أقل من 0.05، فإن هناك علاقة ذات دلالة إحصائية مع متغير الاستجابة في النموذج.
- القيمة p للمتغير المتوقع x2 هي 0.3732 . وبما أن هذه القيمة لا تقل عن 0.05، فلا توجد علاقة ذات دلالة إحصائية مع متغير الاستجابة في النموذج.
تخبرنا رموز الأهمية الموجودة أسفل جدول المعاملات أن علامة النجمة الواحدة (*) بجوار القيمة p البالغة 0.0325 تعني أن القيمة p لها دلالة إحصائية عند α = 0.05.
كيف يتم حساب Pr(>|t|) فعليًا؟
إليك كيفية حساب قيمة Pr(>|t|) فعليًا:
الخطوة 1: احسب قيمة t
أولا، نحسب قيمة t باستخدام الصيغة التالية:
- قيمة t = تقدير / الأمراض المنقولة جنسيا. خطأ
على سبيل المثال، إليك كيفية حساب قيمة t للمتغير المتوقع x1:
#calculate t-value
1.4758 / .5029
[1] 2.934579
الخطوة 2: احسب القيمة الاحتمالية
بعد ذلك، نحسب القيمة p. يمثل هذا احتمال أن تكون القيمة المطلقة لتوزيع t أكبر من 2.935.
يمكننا استخدام الصيغة التالية في R لحساب هذه القيمة:
- القيمة p = 2 * pt (قيمة abs (قيمة t)، df المتبقية، Lower.tail = FALSE)
على سبيل المثال، إليك كيفية حساب القيمة p لقيمة t بقيمة 2.935 مع 5 درجات حرية متبقية:
#calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )
[1] 0.0324441
لاحظ أن هذه القيمة الاحتمالية تطابق القيمة الاحتمالية في مخرجات الانحدار أعلاه.
ملحوظة: قيمة درجات الحرية المتبقية موجودة في أسفل مخرجات الانحدار. في مثالنا، اتضح أنه 5:
Residual standard error: 1.867 on 5 degrees of freedom
مصادر إضافية
كيفية إجراء الانحدار الخطي البسيط في R
كيفية إجراء الانحدار الخطي المتعدد في R
كيفية رسم نتائج الانحدار الخطي المتعددة في R