วิธีการคำนวณช่วงความเชื่อมั่นสำหรับจุดตัดการถดถอย
การถดถอยเชิงเส้นอย่างง่าย ใช้ในการหาปริมาณความสัมพันธ์ระหว่างตัวแปรทำนายและตัวแปรตอบสนอง
วิธีนี้จะค้นหาแถวที่ “ตรงกัน” กับชุดข้อมูลได้ดีที่สุดและใช้รูปแบบต่อไปนี้:
ŷ = ข 0 + ข 1 x
ทอง:
- ŷ : ค่าตอบกลับโดยประมาณ
- b 0 : ต้นกำเนิดของเส้นถดถอย
- b 1 : ความชันของเส้นถดถอย
- x : ค่าของตัวแปรทำนาย
เรามักจะสนใจค่าของ b 1 ซึ่งบอกเราถึงการเปลี่ยนแปลงโดยเฉลี่ยใน ตัวแปรตอบสนอง ที่เกี่ยวข้องกับการเพิ่มขึ้นของตัวแปรทำนายหนึ่งหน่วย
อย่างไรก็ตาม ในสถานการณ์ที่เกิดขึ้นไม่บ่อยนัก เรายังสนใจค่าของ b0 ซึ่งบอกเราถึงค่าเฉลี่ยของตัวแปรตอบสนองเมื่อตัวแปรทำนายเป็นศูนย์
เราสามารถใช้สูตรต่อไปนี้เพื่อคำนวณช่วงความเชื่อมั่นสำหรับค่า β 0 ซึ่งเป็นค่าคงที่ประชากรที่แท้จริง:
ช่วงความเชื่อมั่นสำหรับ β 0 : b 0 ± t α/2, n-2 * se(b 0 )
ตัวอย่างต่อไปนี้แสดงวิธีคำนวณช่วงความเชื่อมั่นสำหรับการสกัดกั้นในทางปฏิบัติ
ตัวอย่าง: ช่วงความเชื่อมั่นสำหรับการสกัดกั้นการถดถอย
สมมติว่าเราต้องการปรับโมเดลการถดถอยเชิงเส้นอย่างง่ายโดยใช้ชั่วโมงที่ศึกษาเป็นตัวแปรทำนายและคะแนนสอบเป็นตัวแปรตอบกลับสำหรับนักเรียน 15 คนในชั้นเรียนหนึ่งๆ:

รหัสต่อไปนี้แสดงวิธีปรับโมเดลการถดถอยเชิงเส้นอย่างง่ายใน R:
#create data frame df <- data. frame (hours=c(1, 2, 4, 5, 5, 6, 6, 7, 8, 10, 11, 11, 12, 12, 14), score=c(64, 66, 76, 73, 74, 81, 83, 82, 80, 88, 84, 82, 91, 93, 89)) #fit simple linear regression model fit <- lm(score ~ hours, data=df) #view summary of model summary(fit) Call: lm(formula = score ~ hours, data = df) Residuals: Min 1Q Median 3Q Max -5,140 -3,219 -1,193 2,816 5,772 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 65,334 2,106 31,023 1.41e-13 *** hours 1.982 0.248 7.995 2.25e-06 *** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.641 on 13 degrees of freedom Multiple R-squared: 0.831, Adjusted R-squared: 0.818 F-statistic: 63.91 on 1 and 13 DF, p-value: 2.253e-06
การใช้การประมาณค่าสัมประสิทธิ์ในผลลัพธ์ เราสามารถเขียนแบบจำลองการถดถอยเชิงเส้นแบบง่ายที่ติดตั้งได้ดังต่อไปนี้:
คะแนน = 65.334 + 1.982*(ชั่วโมงเรียน)
ค่าสกัดกั้นคือ 65.334 สิ่งนี้บอกเราว่าคะแนนสอบเฉลี่ยโดยประมาณสำหรับนักเรียนที่เรียนเป็นเวลา 0 ชั่วโมงคือ 65,334
เราสามารถใช้สูตรต่อไปนี้เพื่อคำนวณช่วงความเชื่อมั่น 95% สำหรับจุดตัดแกน:
- CI 95% สำหรับ β 0 : b 0 ± t α/2, n-2 * se(b 0 )
- CI 95% สำหรับ β 0 : 65.334 ± t 0.05/2.15-2 * 2.106
- CI 95% สำหรับ β 0 : 65.334 ± 2.1604 * 2.106
- CI 95% สำหรับ β 0 : [60.78, 69.88]
เราตีความสิ่งนี้หมายความว่าเรามั่นใจ 95% ว่าคะแนนสอบเฉลี่ยจริงของนักเรียนที่เรียนเป็นเวลา 0 ชั่วโมงอยู่ระหว่าง 60.78 ถึง 69.88
หมายเหตุ : เราใช้เครื่องคำนวณการกระจาย t แบบผกผันเพื่อค้นหาค่า t วิกฤต ซึ่งสอดคล้องกับระดับความเชื่อมั่น 95% โดยมีดีกรีอิสระ 13 องศา
ข้อควรระวังในการคำนวณช่วงความเชื่อมั่นสำหรับจุดตัดการถดถอย
ในทางปฏิบัติ เรามักจะไม่คำนวณช่วงความเชื่อมั่นสำหรับค่าตัดแกนการถดถอย เนื่องจากโดยปกติแล้วมันไม่สมเหตุสมผลเลยที่จะตีความค่าของค่าตัดแกนในการถดถอยแบบจำลอง
ตัวอย่างเช่น สมมติว่าเราพอดีกับแบบจำลองการถดถอยที่ใช้ความสูงของผู้เล่นบาสเก็ตบอลเป็นตัวแปรทำนาย และใช้คะแนนต่อค่าเฉลี่ยของเกมเป็นตัวแปรการตอบสนอง
เป็นไปไม่ได้ที่ผู้เล่นจะมีส่วนสูงเป็นศูนย์ฟุต ดังนั้นจึงไม่เหมาะสมที่จะตีความการสกัดกั้นในโมเดลนี้อย่างแท้จริง
มีสถานการณ์เช่นนี้นับไม่ถ้วนที่ตัวแปรทำนายไม่สามารถรับค่าเป็นศูนย์ได้ ดังนั้นจึงไม่เหมาะสมที่จะตีความค่าดั้งเดิมของแบบจำลองหรือสร้างช่วงความเชื่อมั่นสำหรับจุดเริ่มต้น
ตัวอย่างเช่น พิจารณาตัวแปรตัวทำนายที่เป็นไปได้ต่อไปนี้ในแบบจำลอง:
- พื้นที่ของบ้าน
- ความยาวของรถ
- น้ำหนักของบุคคล
ตัวแปรทำนายแต่ละตัวไม่สามารถรับค่าเป็นศูนย์ได้ ดังนั้นจึงไม่เหมาะสมที่จะคำนวณช่วงความเชื่อมั่นสำหรับที่มาของแบบจำลองการถดถอยในสถานการณ์ใดๆ เหล่านี้
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับการถดถอยเชิงเส้น:
รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นอย่างง่าย
รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นพหุคูณ
วิธีอ่านและตีความตารางการถดถอย
วิธีการรายงานผลการถดถอย