วิธีการตีความ pr(>|t|) ในเอาต์พุตโมเดลการถดถอยใน r
เมื่อใดก็ตามที่คุณทำการถดถอยเชิงเส้นใน R ผลลัพธ์ของแบบจำลองการถดถอยของคุณจะแสดงในรูปแบบต่อไปนี้:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
คอลัมน์ Pr(>|t|) แสดงถึงค่า p ที่เกี่ยวข้องกับค่าในคอลัมน์ ค่า t
หากค่า p ต่ำกว่าระดับนัยสำคัญที่กำหนด (เช่น α = 0.05) ตัวแปรทำนายจะถือว่ามีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับตัวแปรตอบสนองในแบบจำลอง
ตัวอย่างต่อไปนี้แสดงวิธีตีความค่าในคอลัมน์ Pr(>|t|) สำหรับโมเดลการถดถอยที่ระบุ
ตัวอย่าง: วิธีการตีความค่า Pr(>|t|)
สมมติว่าเราต้องการปรับ โมเดลการถดถอยเชิงเส้นหลายตัว ให้พอดีโดยใช้ตัวแปรทำนาย x1 และ x2 และตัวแปรตอบสนองตัวเดียว y
รหัสต่อไปนี้แสดงวิธีสร้างกรอบข้อมูลและปรับแบบจำลองการถดถอยให้พอดีกับข้อมูล:
#create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
x2=c(7, 7, 5, 6, 5, 4, 5, 6),
y=c(8, 8, 9, 9, 13, 14, 17, 14))
#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)
#view model summary
summary(model)
Call:
lm(formula = y ~ x1 + x2, data = df)
Residuals:
1 2 3 4 5 6 7 8
2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208
วิธีตีความค่าในคอลัมน์ Pr(>|t|) มีดังนี้
- ค่า p สำหรับตัวแปรทำนาย x1 คือ 0.0325 เนื่องจากค่านี้น้อยกว่า 0.05 จึงมีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับตัวแปรการตอบสนองในแบบจำลอง
- ค่า p สำหรับตัวแปรทำนาย x2 คือ 0.3732 เนื่องจากค่านี้ไม่น้อยกว่า 0.05 จึงไม่มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับตัวแปรการตอบสนองในแบบจำลอง
รหัสนัยสำคัญ ใต้ตารางสัมประสิทธิ์บอกเราว่าเครื่องหมายดอกจัน (*) ข้างค่า p เท่ากับ 0.0325 หมายความว่าค่า p มีนัยสำคัญทางสถิติที่ α = 0.05
Pr(>|t|) คำนวณจริง ๆ ได้อย่างไร?
ต่อไปนี้เป็นวิธีคำนวณค่าของ Pr(>|t|):
ขั้นตอนที่ 1: คำนวณค่า t
ขั้นแรก เราคำนวณ ค่า t โดยใช้สูตรต่อไปนี้:
- t-value = ประมาณการ / Std ข้อผิดพลาด
ตัวอย่างเช่น ต่อไปนี้เป็นวิธีคำนวณค่า t สำหรับตัวแปรทำนาย x1:
#calculate t-value
1.4758 / .5029
[1] 2.934579
ขั้นตอนที่ 2: คำนวณค่า p
ต่อไป เราจะคำนวณค่า p นี่แสดงถึงความน่าจะเป็นที่ค่าสัมบูรณ์ของการแจกแจงแบบ t มากกว่า 2.935
เราสามารถใช้สูตรต่อไปนี้ใน R เพื่อคำนวณค่านี้:
- p-value = 2 * pt (abs (t-value), df ที่เหลือ, lower.tail = FALSE)
ตัวอย่างเช่น ต่อไปนี้เป็นวิธีคำนวณค่า p สำหรับค่า t 2.935 โดยมีระดับความอิสระคงเหลือ 5 องศา:
#calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )
[1] 0.0324441
โปรดทราบว่าค่า p นี้ตรงกับค่า p ในเอาต์พุตการถดถอยด้านบน
หมายเหตุ: ค่าขององศาอิสระที่เหลืออยู่ที่ด้านล่างของเอาต์พุตการถดถอย ในตัวอย่างของเรา มันกลายเป็น 5:
Residual standard error: 1.867 on 5 degrees of freedom
แหล่งข้อมูลเพิ่มเติม
วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน R
วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน R
วิธีการพล็อตผลลัพธ์การถดถอยเชิงเส้นหลายรายการใน R