วิธีการตีความข้อผิดพลาดมาตรฐานที่เหลือ


ข้อผิดพลาดมาตรฐานที่เหลือใช้ เพื่อวัดว่า แบบจำลองการถดถอย เหมาะสมกับชุดข้อมูลได้ดีเพียงใด

กล่าวง่ายๆ ก็คือ วัดค่าเบี่ยงเบนมาตรฐานของค่าตกค้างในแบบจำลองการถดถอย

มีการคำนวณดังนี้:

ข้อผิดพลาดมาตรฐานคงเหลือ = √ Σ(y – ŷ) 2 /df

ทอง:

  • y: ค่าที่สังเกตได้
  • ŷ: ค่าที่ทำนายไว้
  • df: องศาอิสระ คำนวณจากจำนวนการสังเกตทั้งหมด – จำนวนพารามิเตอร์โมเดลทั้งหมด

ยิ่งข้อผิดพลาดมาตรฐานคงเหลือน้อยลง โมเดลการถดถอยจะพอดีกับชุดข้อมูลก็จะยิ่งดีขึ้นเท่านั้น ในทางกลับกัน ยิ่งค่าความผิดพลาดมาตรฐานตกค้างสูงเท่าใด โมเดลการถดถอยจะพอดีกับชุดข้อมูลก็จะยิ่งแย่ลงเท่านั้น

แบบจำลองการถดถอยที่มีข้อผิดพลาดมาตรฐานตกค้างเล็กน้อยจะมีจุดข้อมูลรวมตัวกันอย่างแน่นหนารอบเส้นการถดถอยที่พอดี:

ปริมาณคงเหลือ ของแบบจำลองนี้ (ความแตกต่างระหว่างค่าที่สังเกตได้และค่าที่คาดการณ์ไว้) จะมีน้อย ซึ่งหมายความว่าข้อผิดพลาดมาตรฐานคงเหลือจะมีน้อยเช่นกัน

ในทางกลับกัน แบบจำลองการถดถอยที่มีข้อผิดพลาดมาตรฐานตกค้างขนาดใหญ่จะมีจุดข้อมูลกระจัดกระจายรอบๆ เส้นการถดถอยที่พอดี:

สารตกค้าง จากแบบจำลองนี้จะมีขนาดใหญ่ขึ้น ซึ่งหมายความว่าข้อผิดพลาดมาตรฐานด้านสารตกค้างจะมีขนาดใหญ่ขึ้นด้วย

ตัวอย่างต่อไปนี้แสดงวิธีคำนวณและตีความข้อผิดพลาดมาตรฐานที่เหลือของแบบจำลองการถดถอยใน R

ตัวอย่าง: การตีความข้อผิดพลาดมาตรฐานที่เหลือ

สมมติว่าเราต้องการปรับโมเดลการถดถอยเชิงเส้นพหุคูณต่อไปนี้:

mpg = β 0 + β 1 (การกระจัด) + β 2 (กำลัง)

แบบจำลองนี้ใช้ตัวแปรทำนาย “การกระจัด” และ “แรงม้า” เพื่อทำนายไมล์ต่อแกลลอนที่รถคันหนึ่งเดินทาง

รหัสต่อไปนี้แสดงวิธีปรับให้พอดีกับโมเดลการถดถอยนี้ใน R:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + hp, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-4.7945 -2.3036 -0.8246 1.8582 6.9363 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

ที่ด้านล่างของผลลัพธ์ เราจะเห็นว่าค่าคลาดเคลื่อนมาตรฐานคงเหลือของรุ่นนี้คือ 3.127

สิ่งนี้บอกเราว่าแบบจำลองการถดถอยทำนายรถยนต์ mpg โดยมีข้อผิดพลาดโดยเฉลี่ยประมาณ 3,127

ใช้ข้อผิดพลาดมาตรฐานที่เหลือเพื่อเปรียบเทียบรุ่น

ข้อผิดพลาดมาตรฐานที่เหลือมีประโยชน์อย่างยิ่งสำหรับการเปรียบเทียบความพอดีของแบบจำลองการถดถอยต่างๆ

ตัวอย่างเช่น สมมติว่าเราใส่แบบจำลองการถดถอยที่แตกต่างกันสองแบบเพื่อทำนาย mpg ของรถยนต์ ข้อผิดพลาดมาตรฐานคงเหลือของแต่ละรุ่นมีดังนี้:

  • ข้อผิดพลาดมาตรฐานที่เหลือของรุ่น 1: 3.127
  • ข้อผิดพลาดมาตรฐานที่เหลือของรุ่น 2: 5.657

เนื่องจากโมเดล 1 มีข้อผิดพลาดมาตรฐานตกค้างต่ำกว่า จึงเหมาะสมกับข้อมูลได้ดีกว่าโมเดล 2 ดังนั้น เราจึงต้องการใช้โมเดล 1 เพื่อทำนาย mpg ของรถยนต์ เนื่องจากการคาดการณ์ที่ทำนั้นใกล้เคียงกับค่า mpg ที่สังเกตได้ของรถยนต์มากกว่า

แหล่งข้อมูลเพิ่มเติม

วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน R
วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน R
วิธีสร้างพล็อตที่เหลือใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *