วิธีทำการทดสอบ durbin-watson ใน r
ข้อสันนิษฐานสำคัญประการหนึ่งของการถดถอยเชิงเส้น คือไม่มีความสัมพันธ์กันระหว่างค่าคงเหลือ กล่าวคือ ค่าตกค้างเป็นอิสระจากกัน
วิธีหนึ่งในการพิจารณาว่าเป็นไปตามสมมติฐานนี้หรือไม่คือทำการ ทดสอบ Durbin-Watson ซึ่งใช้ในการตรวจจับความสัมพันธ์อัตโนมัติในส่วนที่เหลือของการถดถอย การทดสอบนี้ใช้สมมติฐานต่อไปนี้:
H 0 (สมมติฐานว่าง): ไม่มีความสัมพันธ์กันระหว่างสิ่งตกค้าง
H A (สมมติฐานทางเลือก): สารตกค้างมีความสัมพันธ์แบบอัตโนมัติ
บทช่วยสอนนี้จะอธิบายวิธีดำเนินการทดสอบ Durbin-Watson ใน R
ตัวอย่าง: การทดสอบ Durbin-Watson ใน R
หากต้องการทำการทดสอบ Durbin-Watson เราต้องปรับแบบจำลองการถดถอยเชิงเส้นให้เหมาะสมก่อน เราจะใช้ชุดข้อมูล R ที่รวมเข้ากับ mtcars และปรับโมเดลการถดถอยให้เหมาะสมโดยใช้ mpg เป็นตัวแปรทำนาย และ disp และ wt เป็นตัวแปรอธิบาย
#load mtcars dataset data(mtcars) #view first six rows of dataset head(mtcars) mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1 #fit regression model model <- lm(mpg ~ disp+wt, data=mtcars)
จากนั้นเราสามารถทำการทดสอบ Durbin-Watson โดยใช้ฟังก์ชัน durbinWatsonTest() จากแพ็คเกจ เนื่องจาก :
#load car package library(car) #perform Durbin-Watson test durbinWatsonTest(model) Loading required package: carData lag Autocorrelation DW Statistic p-value 1 0.341622 1.276569 0.034 Alternative hypothesis: rho != 0
จากผลลัพธ์เราจะเห็นว่าสถิติการทดสอบคือ 1.276569 และค่า p ที่สอดคล้องกันคือ 0.034 เนื่องจากค่า p นี้น้อยกว่า 0.05 เราจึงสามารถปฏิเสธสมมติฐานว่างและสรุปได้ว่าค่าที่เหลือของแบบจำลองการถดถอยนี้สัมพันธ์กันแบบอัตโนมัติ
จะทำอย่างไรถ้าตรวจพบความสัมพันธ์อัตโนมัติ
หากคุณปฏิเสธสมมติฐานว่างและสรุปว่ามีความสัมพันธ์อัตโนมัติอยู่ในส่วนที่เหลือ คุณจะมีหลายทางเลือกในการแก้ไขปัญหานี้หากคุณพิจารณาว่าเป็นปัญหาร้ายแรงเพียงพอ:
- สำหรับความสัมพันธ์แบบอนุกรมเชิงบวก ให้พิจารณาเพิ่มความล่าช้าของตัวแปรตามและ/หรือตัวแปรอิสระให้กับโมเดล
- สำหรับความสัมพันธ์แบบอนุกรมเชิงลบ ตรวจสอบให้แน่ใจว่าไม่มีตัวแปรใด ล่าช้าเกินไป
- สำหรับความสัมพันธ์ตามฤดูกาล ให้ลองเพิ่มหุ่นตามฤดูกาลให้กับโมเดล