วิธีการตีความ pr(>|z|) ในเอาต์พุตการถดถอยโลจิสติกใน r


เมื่อใดก็ตามที่คุณทำการถดถอยโลจิสติกใน R ผลลัพธ์ของแบบจำลองการถดถอยของคุณจะแสดงในรูปแบบต่อไปนี้:

 Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 * 

คอลัมน์ Pr(>|z|) แสดงถึงค่า p ที่เกี่ยวข้องกับค่าในคอลัมน์ ค่า z

หากค่า p ต่ำกว่าระดับนัยสำคัญที่กำหนด (เช่น α = 0.05) นี่บ่งชี้ว่าตัวแปรทำนายมีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับ ตัวแปรตอบสนอง ในแบบจำลอง

ตัวอย่างต่อไปนี้แสดงวิธีตีความค่าของคอลัมน์ Pr(>|z|) สำหรับแบบจำลองการถดถอยโลจิสติกในทางปฏิบัติ

ตัวอย่าง: วิธีการตีความค่า Pr(>|z|)

รหัสต่อไปนี้แสดงวิธีปรับ โมเดลการถดถอยโลจิสติก ใน R โดยใช้ชุดข้อมูล mtcars ในตัว:

 #fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.5773 -0.2273 -0.1155 0.5196 1.8957  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 21,268 on 29 degrees of freedom
AIC: 27,268

Number of Fisher Scoring iterations: 6

วิธีตีความค่าในคอลัมน์ Pr(>|z|) มีดังนี้

  • ค่า p สำหรับตัวแปรทำนาย “disp” คือ 0.5305 เนื่องจากค่านี้ไม่น้อยกว่า 0.05 จึงไม่มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับตัวแปรการตอบสนองในแบบจำลอง
  • ค่า p สำหรับตัวแปรทำนาย “drat” คือ 0.0315 เนื่องจากค่านี้น้อยกว่า 0.05 จึงมีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับตัวแปรการตอบสนองในแบบจำลอง

รหัสนัยสำคัญ ใต้ตารางสัมประสิทธิ์บอกเราว่าเครื่องหมายดอกจัน (*) ข้างค่า p เท่ากับ 0.0315 หมายความว่าค่า p มีนัยสำคัญทางสถิติที่ α = 0.05

Pr(>|z|) คำนวณอย่างไร

ต่อไปนี้เป็นวิธีคำนวณค่าของ Pr(>|z|):

ขั้นตอนที่ 1: คำนวณค่า z

ขั้นแรก เราคำนวณ ค่า z โดยใช้สูตรต่อไปนี้:

  • ค่า z = ประมาณการ / มาตรฐาน ข้อผิดพลาด

ตัวอย่างเช่น ต่อไปนี้เป็นวิธีคำนวณค่า z สำหรับตัวแปรทำนาย “drat”:

 #calculate z-value
4.879396 / 2.268115

[1] 2.151

ขั้นตอนที่ 2: คำนวณค่า p

ต่อไป เราจะคำนวณค่า p แบบสองด้าน นี่แสดงถึงความน่าจะเป็นที่ค่าสัมบูรณ์ของการแจกแจงแบบปกติมากกว่า 2.151 หรือน้อยกว่า -2.151

เราสามารถใช้สูตรต่อไปนี้ใน R เพื่อคำนวณค่านี้:

  • p-value = 2 * (1-pnorm(z-value))

ตัวอย่างเช่น ต่อไปนี้เป็นวิธีคำนวณค่า p แบบสองด้านสำหรับค่า z เท่ากับ 2.151:

 #calculate p-value
2*(1-pnorm(2.151))

[1] 0.0314762

โปรดทราบว่าค่า p นี้ตรงกับค่า p ในเอาต์พุตการถดถอยด้านบน

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีปรับโมเดลการถดถอยที่แตกต่างกันใน R:

วิธีดำเนินการถดถอยโลจิสติกใน R
วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน R
วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *