วิธีการตีความข้อผิดพลาดมาตรฐานที่เหลือ

โดย ดร.เบนจามิน แอนเดอร์สัน กรกฎาคม 25, 2023 แนะนำ 0 ความคิดเห็น

ข้อผิดพลาดมาตรฐานที่เหลือใช้ เพื่อวัดว่า แบบจำลองการถดถอย เหมาะสมกับชุดข้อมูลได้ดีเพียงใด

กล่าวง่ายๆ ก็คือ วัดค่าเบี่ยงเบนมาตรฐานของค่าตกค้างในแบบจำลองการถดถอย

มีการคำนวณดังนี้:

ข้อผิดพลาดมาตรฐานคงเหลือ = √ Σ(y – ŷ) ² /df

ทอง:

y: ค่าที่สังเกตได้
ŷ: ค่าที่ทำนายไว้
df: องศาอิสระ คำนวณจากจำนวนการสังเกตทั้งหมด – จำนวนพารามิเตอร์โมเดลทั้งหมด

ยิ่งข้อผิดพลาดมาตรฐานคงเหลือน้อยลง โมเดลการถดถอยจะพอดีกับชุดข้อมูลก็จะยิ่งดีขึ้นเท่านั้น ในทางกลับกัน ยิ่งค่าความผิดพลาดมาตรฐานตกค้างสูงเท่าใด โมเดลการถดถอยจะพอดีกับชุดข้อมูลก็จะยิ่งแย่ลงเท่านั้น

แบบจำลองการถดถอยที่มีข้อผิดพลาดมาตรฐานตกค้างเล็กน้อยจะมีจุดข้อมูลรวมตัวกันอย่างแน่นหนารอบเส้นการถดถอยที่พอดี:

ปริมาณคงเหลือ ของแบบจำลองนี้ (ความแตกต่างระหว่างค่าที่สังเกตได้และค่าที่คาดการณ์ไว้) จะมีน้อย ซึ่งหมายความว่าข้อผิดพลาดมาตรฐานคงเหลือจะมีน้อยเช่นกัน

ในทางกลับกัน แบบจำลองการถดถอยที่มีข้อผิดพลาดมาตรฐานตกค้างขนาดใหญ่จะมีจุดข้อมูลกระจัดกระจายรอบๆ เส้นการถดถอยที่พอดี:

สารตกค้าง จากแบบจำลองนี้จะมีขนาดใหญ่ขึ้น ซึ่งหมายความว่าข้อผิดพลาดมาตรฐานด้านสารตกค้างจะมีขนาดใหญ่ขึ้นด้วย

ตัวอย่างต่อไปนี้แสดงวิธีคำนวณและตีความข้อผิดพลาดมาตรฐานที่เหลือของแบบจำลองการถดถอยใน R

ตัวอย่าง: การตีความข้อผิดพลาดมาตรฐานที่เหลือ

สมมติว่าเราต้องการปรับโมเดลการถดถอยเชิงเส้นพหุคูณต่อไปนี้:

mpg = β ₀ + β ₁ (การกระจัด) + β ₂ (กำลัง)

แบบจำลองนี้ใช้ตัวแปรทำนาย “การกระจัด” และ “แรงม้า” เพื่อทำนายไมล์ต่อแกลลอนที่รถคันหนึ่งเดินทาง

รหัสต่อไปนี้แสดงวิธีปรับให้พอดีกับโมเดลการถดถอยนี้ใน R:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + hp, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-4.7945 -2.3036 -0.8246 1.8582 6.9363 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

ที่ด้านล่างของผลลัพธ์ เราจะเห็นว่าค่าคลาดเคลื่อนมาตรฐานคงเหลือของรุ่นนี้คือ 3.127

สิ่งนี้บอกเราว่าแบบจำลองการถดถอยทำนายรถยนต์ mpg โดยมีข้อผิดพลาดโดยเฉลี่ยประมาณ 3,127

ใช้ข้อผิดพลาดมาตรฐานที่เหลือเพื่อเปรียบเทียบรุ่น

ข้อผิดพลาดมาตรฐานที่เหลือมีประโยชน์อย่างยิ่งสำหรับการเปรียบเทียบความพอดีของแบบจำลองการถดถอยต่างๆ

ตัวอย่างเช่น สมมติว่าเราใส่แบบจำลองการถดถอยที่แตกต่างกันสองแบบเพื่อทำนาย mpg ของรถยนต์ ข้อผิดพลาดมาตรฐานคงเหลือของแต่ละรุ่นมีดังนี้:

ข้อผิดพลาดมาตรฐานที่เหลือของรุ่น 1: 3.127
ข้อผิดพลาดมาตรฐานที่เหลือของรุ่น 2: 5.657

เนื่องจากโมเดล 1 มีข้อผิดพลาดมาตรฐานตกค้างต่ำกว่า จึงเหมาะสมกับข้อมูลได้ดีกว่าโมเดล 2 ดังนั้น เราจึงต้องการใช้โมเดล 1 เพื่อทำนาย mpg ของรถยนต์ เนื่องจากการคาดการณ์ที่ทำนั้นใกล้เคียงกับค่า mpg ที่สังเกตได้ของรถยนต์มากกว่า

แหล่งข้อมูลเพิ่มเติม

วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน R
วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน R
วิธีสร้างพล็อตที่เหลือใน R

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

สวัสดี ฉันชื่อเบนจามิน ศาสตราจารย์สถิติเกษียณอายุแล้ว และผันตัวมาเป็นครูสอนสถิติโดยเฉพาะ ด้วยประสบการณ์และความเชี่ยวชาญที่กว้างขวางในสาขาสถิติ ฉันกระตือรือร้นที่จะแบ่งปันความรู้ของฉันเพื่อเสริมศักยภาพนักเรียนผ่าน Statorials. รู้เพิ่มเติม

ตัวอย่าง: การตีความข้อผิดพลาดมาตรฐานที่เหลือ

ใช้ข้อผิดพลาดมาตรฐานที่เหลือเพื่อเปรียบเทียบรุ่น

แหล่งข้อมูลเพิ่มเติม

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

เพิ่มความคิดเห็น