การถดถอยแบบโค้งคืออะไร? (คำจำกัดความและตัวอย่าง)


การถดถอยแบบเส้นโค้ง เป็นชื่อที่ตั้งให้กับแบบจำลองการถดถอยใดๆ ที่พยายามทำให้ เส้นโค้ง พอดีแทนที่จะเป็นเส้นตรง

ตัวอย่างทั่วไปของแบบจำลองการถดถอยแบบโค้งได้แก่:

การถดถอยกำลังสอง: ใช้เมื่อมีความสัมพันธ์กำลังสองระหว่างตัวแปรทำนายและ ตัวแปรตอบสนอง เมื่อสร้างกราฟแล้ว ความสัมพันธ์ประเภทนี้จะดูเหมือน “U” หรือ “U” กลับหัวบนแผนภาพกระจาย:

การถดถอยแบบลูกบาศก์: ใช้เมื่อมีความสัมพันธ์แบบลูกบาศก์ระหว่างตัวแปรทำนายและตัวแปรตอบสนอง เมื่อสร้างกราฟ ความสัมพันธ์ประเภทนี้จะแสดงเส้นโค้งที่แตกต่างกันสองเส้นบนแผนภาพกระจาย:

ความแตกต่างทั้งสองนี้กับ การถดถอยเชิงเส้นอย่างง่าย ซึ่งความสัมพันธ์ระหว่างตัวแปรทำนายและตัวแปรการตอบสนองเป็นแบบเส้นตรง:

สูตรสำหรับแบบจำลองการถดถอยแบบโค้ง

แบบจำลองการถดถอยเชิงเส้นอย่างง่าย จะพยายามปรับชุดข้อมูลให้พอดีโดยใช้สูตรต่อไปนี้:

ŷ = β 0 + β 1 x

ทอง:

  • ŷ: ตัวแปรตอบสนอง
  • β 0 , β 1 : ค่าสัมประสิทธิ์การถดถอย
  • x: ตัวแปรทำนาย

ในทางตรงกันข้าม โมเดลการถดถอยกำลังสอง ใช้สูตรต่อไปนี้:

ŷ = β 0 + β 1 x + β 2 x 2

และ แบบจำลองการถดถอยลูกบาศก์ ใช้สูตรต่อไปนี้:

ŷ = β 0 + β 1 x + β 2 x 2 + β 3 x 3

ชื่อทั่วไปที่เรียกโมเดลการถดถอยที่มีเลขชี้กำลังคือ การถดถอยพหุนาม ซึ่งใช้สูตรต่อไปนี้:

ŷ = β 0 + β 1 x + β 2 x 2 + … + β k x k

ค่า k บ่งบอกถึง ระดับ ของพหุนาม แม้ว่าดีกรีอาจเป็นจำนวนบวกใดๆ ก็ได้ แต่ในทางปฏิบัติ เราไม่ค่อยเหมาะกับแบบจำลองการถดถอยพหุนามที่มีดีกรีมากกว่า 3 หรือ 4

ด้วยการใช้เลขชี้กำลังในสูตรแบบจำลองการถดถอย แบบจำลองการถดถอยพหุนามจึงสามารถจัด เส้นโค้ง ให้พอดีกับชุดข้อมูลแทนที่จะเป็นเส้นตรงได้

เมื่อใดจึงควรใช้การถดถอยแบบโค้ง

วิธีที่ง่ายที่สุดในการทราบว่าคุณควรใช้การถดถอยแบบโค้งหรือไม่คือการสร้างแผนภาพกระจายของตัวแปรทำนายและตัวแปรตอบสนอง

หากแผนภาพกระจายแสดงความสัมพันธ์เชิงเส้นระหว่างตัวแปรทั้งสอง การถดถอยเชิงเส้นอย่างง่ายน่าจะเหมาะสม

อย่างไรก็ตาม หากแผนภาพกระจายแสดงรูปแบบกำลังสอง ลูกบาศก์ หรือเส้นโค้งอื่นๆ ระหว่างตัวทำนายและตัวแปรตอบสนอง การถดถอยของเส้นโค้งน่าจะเหมาะสมกว่าที่จะใช้

คุณยังสามารถติดตั้งแบบจำลองการถดถอยเชิงเส้นอย่างง่ายและแบบจำลองการถดถอยแบบโค้ง และเปรียบเทียบ ค่า R-squared ของแต่ละรุ่นเพื่อพิจารณาว่าแบบจำลองใดที่เหมาะกับข้อมูลมากที่สุด

ค่า R-squared ที่ปรับแล้วมีประโยชน์เนื่องจากจะบอกคุณว่าตัวแปรตัวทำนายสามารถอธิบายความแปรปรวนในตัวแปรตอบสนองได้มากเพียงใด ซึ่งปรับตามจำนวนตัวแปรตัวทำนายในแบบจำลองแล้ว

โดยทั่วไป โมเดลที่มีค่า R-squared ที่ปรับสูงสุดจะเหมาะกับชุดข้อมูลมากกว่า

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีการถดถอยพหุนามในซอฟต์แวร์ทางสถิติต่างๆ:

ความรู้เบื้องต้นเกี่ยวกับการถดถอยพหุนาม
วิธีการดำเนินการถดถอยพหุนามใน Excel
วิธีดำเนินการถดถอยพหุนามใน Python
วิธีดำเนินการถดถอยพหุนามใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *