วิธีการตีความข้อผิดพลาดมาตรฐานที่เหลือ
ข้อผิดพลาดมาตรฐานที่เหลือใช้ เพื่อวัดว่า แบบจำลองการถดถอย เหมาะสมกับชุดข้อมูลได้ดีเพียงใด
กล่าวง่ายๆ ก็คือ วัดค่าเบี่ยงเบนมาตรฐานของค่าตกค้างในแบบจำลองการถดถอย
มีการคำนวณดังนี้:
ข้อผิดพลาดมาตรฐานคงเหลือ = √ Σ(y – ŷ) 2 /df
ทอง:
- y: ค่าที่สังเกตได้
- ŷ: ค่าที่ทำนายไว้
- df: องศาอิสระ คำนวณจากจำนวนการสังเกตทั้งหมด – จำนวนพารามิเตอร์โมเดลทั้งหมด
ยิ่งข้อผิดพลาดมาตรฐานคงเหลือน้อยลง โมเดลการถดถอยจะพอดีกับชุดข้อมูลก็จะยิ่งดีขึ้นเท่านั้น ในทางกลับกัน ยิ่งค่าความผิดพลาดมาตรฐานตกค้างสูงเท่าใด โมเดลการถดถอยจะพอดีกับชุดข้อมูลก็จะยิ่งแย่ลงเท่านั้น
แบบจำลองการถดถอยที่มีข้อผิดพลาดมาตรฐานตกค้างเล็กน้อยจะมีจุดข้อมูลรวมตัวกันอย่างแน่นหนารอบเส้นการถดถอยที่พอดี:

ปริมาณคงเหลือ ของแบบจำลองนี้ (ความแตกต่างระหว่างค่าที่สังเกตได้และค่าที่คาดการณ์ไว้) จะมีน้อย ซึ่งหมายความว่าข้อผิดพลาดมาตรฐานคงเหลือจะมีน้อยเช่นกัน
ในทางกลับกัน แบบจำลองการถดถอยที่มีข้อผิดพลาดมาตรฐานตกค้างขนาดใหญ่จะมีจุดข้อมูลกระจัดกระจายรอบๆ เส้นการถดถอยที่พอดี:

สารตกค้าง จากแบบจำลองนี้จะมีขนาดใหญ่ขึ้น ซึ่งหมายความว่าข้อผิดพลาดมาตรฐานด้านสารตกค้างจะมีขนาดใหญ่ขึ้นด้วย
ตัวอย่างต่อไปนี้แสดงวิธีคำนวณและตีความข้อผิดพลาดมาตรฐานที่เหลือของแบบจำลองการถดถอยใน R
ตัวอย่าง: การตีความข้อผิดพลาดมาตรฐานที่เหลือ
สมมติว่าเราต้องการปรับโมเดลการถดถอยเชิงเส้นพหุคูณต่อไปนี้:
mpg = β 0 + β 1 (การกระจัด) + β 2 (กำลัง)
แบบจำลองนี้ใช้ตัวแปรทำนาย “การกระจัด” และ “แรงม้า” เพื่อทำนายไมล์ต่อแกลลอนที่รถคันหนึ่งเดินทาง
รหัสต่อไปนี้แสดงวิธีปรับให้พอดีกับโมเดลการถดถอยนี้ใน R:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + hp, data = mtcars) Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
ที่ด้านล่างของผลลัพธ์ เราจะเห็นว่าค่าคลาดเคลื่อนมาตรฐานคงเหลือของรุ่นนี้คือ 3.127
สิ่งนี้บอกเราว่าแบบจำลองการถดถอยทำนายรถยนต์ mpg โดยมีข้อผิดพลาดโดยเฉลี่ยประมาณ 3,127
ใช้ข้อผิดพลาดมาตรฐานที่เหลือเพื่อเปรียบเทียบรุ่น
ข้อผิดพลาดมาตรฐานที่เหลือมีประโยชน์อย่างยิ่งสำหรับการเปรียบเทียบความพอดีของแบบจำลองการถดถอยต่างๆ
ตัวอย่างเช่น สมมติว่าเราใส่แบบจำลองการถดถอยที่แตกต่างกันสองแบบเพื่อทำนาย mpg ของรถยนต์ ข้อผิดพลาดมาตรฐานคงเหลือของแต่ละรุ่นมีดังนี้:
- ข้อผิดพลาดมาตรฐานที่เหลือของรุ่น 1: 3.127
- ข้อผิดพลาดมาตรฐานที่เหลือของรุ่น 2: 5.657
เนื่องจากโมเดล 1 มีข้อผิดพลาดมาตรฐานตกค้างต่ำกว่า จึงเหมาะสมกับข้อมูลได้ดีกว่าโมเดล 2 ดังนั้น เราจึงต้องการใช้โมเดล 1 เพื่อทำนาย mpg ของรถยนต์ เนื่องจากการคาดการณ์ที่ทำนั้นใกล้เคียงกับค่า mpg ที่สังเกตได้ของรถยนต์มากกว่า
แหล่งข้อมูลเพิ่มเติม
วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน R
วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน R
วิธีสร้างพล็อตที่เหลือใน R