วิธีการคำนวณช่วงความเชื่อมั่นสำหรับจุดตัดการถดถอย


การถดถอยเชิงเส้นอย่างง่าย ใช้ในการหาปริมาณความสัมพันธ์ระหว่างตัวแปรทำนายและตัวแปรตอบสนอง

วิธีนี้จะค้นหาแถวที่ “ตรงกัน” กับชุดข้อมูลได้ดีที่สุดและใช้รูปแบบต่อไปนี้:

ŷ = ข 0 + ข 1 x

ทอง:

  • ŷ : ค่าตอบกลับโดยประมาณ
  • b 0 : ต้นกำเนิดของเส้นถดถอย
  • b 1 : ความชันของเส้นถดถอย
  • x : ค่าของตัวแปรทำนาย

เรามักจะสนใจค่าของ b 1 ซึ่งบอกเราถึงการเปลี่ยนแปลงโดยเฉลี่ยใน ตัวแปรตอบสนอง ที่เกี่ยวข้องกับการเพิ่มขึ้นของตัวแปรทำนายหนึ่งหน่วย

อย่างไรก็ตาม ในสถานการณ์ที่เกิดขึ้นไม่บ่อยนัก เรายังสนใจค่าของ b0 ซึ่งบอกเราถึงค่าเฉลี่ยของตัวแปรตอบสนองเมื่อตัวแปรทำนายเป็นศูนย์

เราสามารถใช้สูตรต่อไปนี้เพื่อคำนวณช่วงความเชื่อมั่นสำหรับค่า β 0 ซึ่งเป็นค่าคงที่ประชากรที่แท้จริง:

ช่วงความเชื่อมั่นสำหรับ β 0 : b 0 ± t α/2, n-2 * se(b 0 )

ตัวอย่างต่อไปนี้แสดงวิธีคำนวณช่วงความเชื่อมั่นสำหรับการสกัดกั้นในทางปฏิบัติ

ตัวอย่าง: ช่วงความเชื่อมั่นสำหรับการสกัดกั้นการถดถอย

สมมติว่าเราต้องการปรับโมเดลการถดถอยเชิงเส้นอย่างง่ายโดยใช้ชั่วโมงที่ศึกษาเป็นตัวแปรทำนายและคะแนนสอบเป็นตัวแปรตอบกลับสำหรับนักเรียน 15 คนในชั้นเรียนหนึ่งๆ:

รหัสต่อไปนี้แสดงวิธีปรับโมเดลการถดถอยเชิงเส้นอย่างง่ายใน R:

 #create data frame
df <- data. frame (hours=c(1, 2, 4, 5, 5, 6, 6, 7, 8, 10, 11, 11, 12, 12, 14),
                 score=c(64, 66, 76, 73, 74, 81, 83, 82, 80, 88, 84, 82, 91, 93, 89))

#fit simple linear regression model
fit <- lm(score ~ hours, data=df)

#view summary of model
summary(fit)

Call:
lm(formula = score ~ hours, data = df)

Residuals:
   Min 1Q Median 3Q Max 
-5,140 -3,219 -1,193 2,816 5,772 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 65,334 2,106 31,023 1.41e-13 ***
hours 1.982 0.248 7.995 2.25e-06 ***
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.641 on 13 degrees of freedom
Multiple R-squared: 0.831, Adjusted R-squared: 0.818 
F-statistic: 63.91 on 1 and 13 DF, p-value: 2.253e-06

การใช้การประมาณค่าสัมประสิทธิ์ในผลลัพธ์ เราสามารถเขียนแบบจำลองการถดถอยเชิงเส้นแบบง่ายที่ติดตั้งได้ดังต่อไปนี้:

คะแนน = 65.334 + 1.982*(ชั่วโมงเรียน)

ค่าสกัดกั้นคือ 65.334 สิ่งนี้บอกเราว่าคะแนนสอบเฉลี่ยโดยประมาณสำหรับนักเรียนที่เรียนเป็นเวลา 0 ชั่วโมงคือ 65,334

เราสามารถใช้สูตรต่อไปนี้เพื่อคำนวณช่วงความเชื่อมั่น 95% สำหรับจุดตัดแกน:

  • CI 95% สำหรับ β 0 : b 0 ± t α/2, n-2 * se(b 0 )
  • CI 95% สำหรับ β 0 : 65.334 ± t 0.05/2.15-2 * 2.106
  • CI 95% สำหรับ β 0 : 65.334 ± 2.1604 * 2.106
  • CI 95% สำหรับ β 0 : [60.78, 69.88]

เราตีความสิ่งนี้หมายความว่าเรามั่นใจ 95% ว่าคะแนนสอบเฉลี่ยจริงของนักเรียนที่เรียนเป็นเวลา 0 ชั่วโมงอยู่ระหว่าง 60.78 ถึง 69.88

หมายเหตุ : เราใช้เครื่องคำนวณการกระจาย t แบบผกผันเพื่อค้นหาค่า t วิกฤต ซึ่งสอดคล้องกับระดับความเชื่อมั่น 95% โดยมีดีกรีอิสระ 13 องศา

ข้อควรระวังในการคำนวณช่วงความเชื่อมั่นสำหรับจุดตัดการถดถอย

ในทางปฏิบัติ เรามักจะไม่คำนวณช่วงความเชื่อมั่นสำหรับค่าตัดแกนการถดถอย เนื่องจากโดยปกติแล้วมันไม่สมเหตุสมผลเลยที่จะตีความค่าของค่าตัดแกนในการถดถอยแบบจำลอง

ตัวอย่างเช่น สมมติว่าเราพอดีกับแบบจำลองการถดถอยที่ใช้ความสูงของผู้เล่นบาสเก็ตบอลเป็นตัวแปรทำนาย และใช้คะแนนต่อค่าเฉลี่ยของเกมเป็นตัวแปรการตอบสนอง

เป็นไปไม่ได้ที่ผู้เล่นจะมีส่วนสูงเป็นศูนย์ฟุต ดังนั้นจึงไม่เหมาะสมที่จะตีความการสกัดกั้นในโมเดลนี้อย่างแท้จริง

มีสถานการณ์เช่นนี้นับไม่ถ้วนที่ตัวแปรทำนายไม่สามารถรับค่าเป็นศูนย์ได้ ดังนั้นจึงไม่เหมาะสมที่จะตีความค่าดั้งเดิมของแบบจำลองหรือสร้างช่วงความเชื่อมั่นสำหรับจุดเริ่มต้น

ตัวอย่างเช่น พิจารณาตัวแปรตัวทำนายที่เป็นไปได้ต่อไปนี้ในแบบจำลอง:

  • พื้นที่ของบ้าน
  • ความยาวของรถ
  • น้ำหนักของบุคคล

ตัวแปรทำนายแต่ละตัวไม่สามารถรับค่าเป็นศูนย์ได้ ดังนั้นจึงไม่เหมาะสมที่จะคำนวณช่วงความเชื่อมั่นสำหรับที่มาของแบบจำลองการถดถอยในสถานการณ์ใดๆ เหล่านี้

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับการถดถอยเชิงเส้น:

รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นอย่างง่าย
รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นพหุคูณ
วิธีอ่านและตีความตารางการถดถอย
วิธีการรายงานผลการถดถอย

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *