วิธีสร้างพล็อตที่เหลือใน r


แผนส่วนที่เหลือ มักใช้ในการประเมินว่า ส่วนที่เหลือ จากการวิเคราะห์การถดถอยมีการกระจายตามปกติหรือไม่ และพวกมันแสดง ความแตกต่างกัน หรือไม่

บทช่วยสอนนี้จะอธิบายวิธีสร้างแปลงที่เหลือสำหรับแบบจำลองการถดถอยใน R

ตัวอย่าง: แปลงที่เหลือในอาร์

ในตัวอย่างนี้ เราจะปรับแบบจำลองการถดถอยโดยใช้ชุดข้อมูล R ในตัวของ mtcars จากนั้นจึงสร้างแปลงส่วนที่เหลือที่แตกต่างกันสามรายการเพื่อวิเคราะห์ส่วนที่เหลือ

ขั้นตอนที่ 1: ติดตั้งโมเดลการถดถอย

ขั้นแรก เราจะปรับโมเดลการถดถอยโดยใช้ mpg เป็นตัวแปรตอบสนอง และใช้ disp และ hp เป็นตัวแปรอธิบาย:

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#get list of residuals 
res <- resid(model)

ขั้นตอนที่ 2: สร้างพล็อตที่เหลือหรือปรับแล้ว

ต่อไป เราจะสร้างพล็อตส่วนที่เหลือ/ติดตั้ง ซึ่งมีประโยชน์สำหรับการตรวจจับความแตกต่างทางสายตา ตัวอย่างเช่น การเปลี่ยนแปลงอย่างเป็นระบบในการกระจายของส่วนที่เหลือในช่วงของค่า

 #produce residual vs. fitted plot
plot(fitted(model), res)

#add a horizontal line at 0 
abline(0,0)

ภูมิประเทศที่เหลือหรือปรับใน R

แกน x จะแสดงค่าที่พอดี และแกน y จะแสดงค่าคงเหลือ จากกราฟ เราจะเห็นว่าการกระจายตัวของสารตกค้างมีแนวโน้มที่จะสูงขึ้นสำหรับค่าที่ติดตั้งที่สูงกว่า แต่ดูเหมือนว่าจะไม่รุนแรงพอที่จะเราต้องทำการเปลี่ยนแปลงแบบจำลอง

ขั้นตอนที่ 3: สร้างพล็อต QQ

นอกจากนี้เรายังสามารถสร้างพล็อต QQ ซึ่งมีประโยชน์ในการพิจารณาว่าส่วนที่เหลือเป็นไปตามการแจกแจงแบบปกติหรือไม่ หากค่าข้อมูลในพล็อตเป็นเส้นตรงประมาณ 45 องศา แสดงว่าข้อมูลมีการกระจายตามปกติ

 #create QQ plot for residuals
qqnorm(res)

#add a straight diagonal line to the plot
qqline(res) 

พล็อต QQ ที่เหลือใน R

เราจะเห็นได้ว่ากากที่เหลือมักจะเบี่ยงเบนไปจากเส้นใกล้หางเล็กน้อยซึ่งอาจบ่งชี้ได้ว่าไม่กระจายตามปกติ

ขั้นตอนที่ 4: สร้างแผนภูมิความหนาแน่น

นอกจากนี้เรายังสามารถสร้างแผนภูมิความหนาแน่นได้ ซึ่งมีประโยชน์สำหรับการตรวจสอบด้วยสายตาว่าสารตกค้างมีการกระจายตามปกติหรือไม่ หากแปลงเป็นรูประฆังโดยประมาณ ส่วนที่เหลืออาจเป็นไปตามการแจกแจงแบบปกติ

 #Create density plot of residuals
plot(density(res))

กราฟความหนาแน่นคงเหลือในหน่วย R

เราจะเห็นว่าแผนภูมิความหนาแน่นมีลักษณะเป็นทรงระฆังโดยประมาณ แม้ว่าจะเอียงไปทางขวาเล็กน้อยก็ตาม นักวิจัยอาจหรืออาจจะไม่ตัดสินใจที่จะดำเนินการเปลี่ยนแปลงข้อมูลเพื่อให้แน่ใจว่าส่วนที่เหลือมีการกระจายตามปกติมากขึ้น ทั้งนี้ขึ้นอยู่กับประเภทของการศึกษา

แหล่งข้อมูลเพิ่มเติม

วิธีการคำนวณปริมาณคงเหลือมาตรฐานใน R
วิธีการคำนวณยอดคงเหลือของนักเรียนใน R
วิธีสร้างฮิสโตแกรมของสารตกค้างใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *