วิธีการตีความ pr(>|t|) ในเอาต์พุตโมเดลการถดถอยใน r


เมื่อใดก็ตามที่คุณทำการถดถอยเชิงเส้นใน R ผลลัพธ์ของแบบจำลองการถดถอยของคุณจะแสดงในรูปแบบต่อไปนี้:

 Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732 

คอลัมน์ Pr(>|t|) แสดงถึงค่า p ที่เกี่ยวข้องกับค่าในคอลัมน์ ค่า t

หากค่า p ต่ำกว่าระดับนัยสำคัญที่กำหนด (เช่น α = 0.05) ตัวแปรทำนายจะถือว่ามีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับตัวแปรตอบสนองในแบบจำลอง

ตัวอย่างต่อไปนี้แสดงวิธีตีความค่าในคอลัมน์ Pr(>|t|) สำหรับโมเดลการถดถอยที่ระบุ

ตัวอย่าง: วิธีการตีความค่า Pr(>|t|)

สมมติว่าเราต้องการปรับ โมเดลการถดถอยเชิงเส้นหลายตัว ให้พอดีโดยใช้ตัวแปรทำนาย x1 และ x2 และตัวแปรตอบสนองตัวเดียว y

รหัสต่อไปนี้แสดงวิธีสร้างกรอบข้อมูลและปรับแบบจำลองการถดถอยให้พอดีกับข้อมูล:

 #create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
                 x2=c(7, 7, 5, 6, 5, 4, 5, 6),
                 y=c(8, 8, 9, 9, 13, 14, 17, 14))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#view model summary
summary(model)

Call:
lm(formula = y ~ x1 + x2, data = df)

Residuals:
      1 2 3 4 5 6 7 8 
 2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026 
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208

วิธีตีความค่าในคอลัมน์ Pr(>|t|) มีดังนี้

  • ค่า p สำหรับตัวแปรทำนาย x1 คือ 0.0325 เนื่องจากค่านี้น้อยกว่า 0.05 จึงมีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับตัวแปรการตอบสนองในแบบจำลอง
  • ค่า p สำหรับตัวแปรทำนาย x2 คือ 0.3732 เนื่องจากค่านี้ไม่น้อยกว่า 0.05 จึงไม่มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับตัวแปรการตอบสนองในแบบจำลอง

รหัสนัยสำคัญ ใต้ตารางสัมประสิทธิ์บอกเราว่าเครื่องหมายดอกจัน (*) ข้างค่า p เท่ากับ 0.0325 หมายความว่าค่า p มีนัยสำคัญทางสถิติที่ α = 0.05

Pr(>|t|) คำนวณจริง ๆ ได้อย่างไร?

ต่อไปนี้เป็นวิธีคำนวณค่าของ Pr(>|t|):

ขั้นตอนที่ 1: คำนวณค่า t

ขั้นแรก เราคำนวณ ค่า t โดยใช้สูตรต่อไปนี้:

  • t-value = ประมาณการ / Std ข้อผิดพลาด

ตัวอย่างเช่น ต่อไปนี้เป็นวิธีคำนวณค่า t สำหรับตัวแปรทำนาย x1:

 #calculate t-value
1.4758 / .5029

[1] 2.934579

ขั้นตอนที่ 2: คำนวณค่า p

ต่อไป เราจะคำนวณค่า p นี่แสดงถึงความน่าจะเป็นที่ค่าสัมบูรณ์ของการแจกแจงแบบ t มากกว่า 2.935

เราสามารถใช้สูตรต่อไปนี้ใน R เพื่อคำนวณค่านี้:

  • p-value = 2 * pt (abs (t-value), df ที่เหลือ, lower.tail = FALSE)

ตัวอย่างเช่น ต่อไปนี้เป็นวิธีคำนวณค่า p สำหรับค่า t 2.935 โดยมีระดับความอิสระคงเหลือ 5 องศา:

 #calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )

[1] 0.0324441

โปรดทราบว่าค่า p นี้ตรงกับค่า p ในเอาต์พุตการถดถอยด้านบน

หมายเหตุ: ค่าขององศาอิสระที่เหลืออยู่ที่ด้านล่างของเอาต์พุตการถดถอย ในตัวอย่างของเรา มันกลายเป็น 5:

 Residual standard error: 1.867 on 5 degrees of freedom

แหล่งข้อมูลเพิ่มเติม

วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน R
วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน R
วิธีการพล็อตผลลัพธ์การถดถอยเชิงเส้นหลายรายการใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *