วิธีสร้างพล็อตที่เหลือใน ggplot2 (พร้อมตัวอย่าง)


แปลงที่เหลือใช้ เพื่อประเมินว่า ส่วนที่เหลือ ของแบบจำลองการถดถอยมีการกระจายตามปกติหรือไม่ และพวกมันแสดง ความแตกต่างกัน หรือไม่

หากต้องการสร้างพล็อตที่เหลือใน ggplot2 คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้:

 library (ggplot2)

ggplot(model, aes(x = .fitted, y = .resid)) +
  geom_point() +
  geom_hline(yintercept = 0 )

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่าง: การสร้างพล็อตที่เหลือใน ggplot2

สำหรับตัวอย่างนี้ เราจะใช้ชุดข้อมูล mtcars ที่สร้างไว้ใน R:

 #view first six rows of mtcars dataset
head(mtcars)
                   mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1

ขั้นแรก เราจะปรับโมเดลการถดถอยโดยใช้ mpg เป็นตัวแปรตอบสนอง และ qsec เป็นตัวแปรทำนาย:

 #fit regression model
model <- lm(mpg ~ qsec, data=mtcars)

ต่อไป เราจะใช้ไวยากรณ์ต่อไปนี้เพื่อสร้างพล็อตที่เหลือใน ggplot2:

 library (ggplot2)

#create residual plot
ggplot(model, aes(x = .fitted, y = .resid)) +
  geom_point() +
  geom_hline(yintercept = 0 ) 

แปลงที่เหลือใน ggplot2

แกน x จะแสดงค่าที่พอดี และแกน y จะแสดงค่าคงเหลือ

ส่วนที่เหลือดูเหมือนจะกระจัดกระจายแบบสุ่มรอบๆ ศูนย์โดยไม่มีรูปแบบที่ชัดเจน ซึ่งบ่งชี้ว่าสมมติฐานของการโฮโมสเคดาสติกเป็นที่พอใจ

กล่าวอีกนัยหนึ่ง ค่าสัมประสิทธิ์ ของแบบจำลองการถดถอยควรเชื่อถือได้ และเราไม่จำเป็นต้องทำการ เปลี่ยนแปลง ข้อมูลใดๆ

โปรดทราบว่าเราสามารถใช้ฟังก์ชัน labs() เพื่อเพิ่มป้ายกำกับชื่อและแกนให้กับพล็อตที่เหลือ:

 library (ggplot2)

#create residual plot with title and axis labels
ggplot(model, aes(x = .fitted, y = .resid)) +
  geom_point() +
  geom_hline(yintercept = 0 ) +
  labs(title=' Residual vs. Fitted Values Plot ', x=' Fitted Values ', y=' Residuals ') 

ggplot2 พล็อตค่าคงเหลือเทียบกับค่าที่ติดตั้งด้วยป้ายกำกับแกน

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน R:

วิธีการคำนวณปริมาณคงเหลือมาตรฐานใน R
วิธีการคำนวณยอดคงเหลือของนักเรียนใน R
วิธีสร้างฮิสโตแกรมของสารตกค้างใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *