การถดถอยพหุนาม
บทความนี้จะอธิบายว่าการถดถอยพหุนามในสถิติคืออะไร และดำเนินการอย่างไร นอกจากนี้ คุณจะสามารถดูตัวอย่างที่ใช้การถดถอยพหุนามได้
การถดถอยพหุนามคืออะไร?
การถดถอยพหุนาม หรือ การถดถอยพหุนาม เป็นแบบจำลองการถดถอยที่ความสัมพันธ์ระหว่างตัวแปรอิสระ X และตัวแปรตาม Y ถูกจำลองโดยใช้พหุนาม
ตัวอย่างเช่น สมการสำหรับแบบจำลองการถดถอยพหุนามกำลังสองคือ y=β 0 +β 1 x+β 2 x 2 +ε
การถดถอยพหุนามมีประโยชน์สำหรับการปรับชุดข้อมูลให้เหมาะสมซึ่งมีกราฟเป็นเส้นโค้งพหุนาม ดังนั้น หากดอทพล็อตของตัวอย่างข้อมูลมีรูปร่างเป็นรูปพาราโบลา การสร้างแบบจำลองการถดถอยกำลังสองจะดีกว่าการสร้างแบบจำลองการถดถอยเชิงเส้น ด้วยวิธีนี้ สมการแบบจำลองการถดถอยจะเข้ากับตัวอย่างข้อมูลได้ดีขึ้น
โปรดทราบว่าการถดถอยพหุนามเป็นการถดถอยแบบไม่เชิงเส้นประเภทหนึ่ง เช่นเดียวกับการถดถอยเอ็กซ์โปเนนเชียลและการถดถอยแบบลอการิทึม
สูตรการถดถอยพหุนาม
สมการสำหรับแบบจำลองการถดถอยพหุนามคือ y=β 0 +β 1 x+β 2 x 2 +β 3 x 3 …+β m x m +ε
ทอง:
-
เป็นตัวแปรตาม
-
เป็นตัวแปรอิสระ
-
คือค่าคงที่ของสมการถดถอยพหุนาม
-
คือค่าสัมประสิทธิ์การถดถอยที่เกี่ยวข้องกับตัวแปร
.
-
นี่คือข้อผิดพลาดหรือค่าตกค้าง ซึ่งหมายถึงความแตกต่างระหว่างค่าที่สังเกตได้กับค่าที่ประเมินโดยแบบจำลอง
แล้วถ้าเรามีตัวอย่างที่มีผลรวมเป็น
จากการสังเกต เราสามารถเสนอแบบจำลองการถดถอยพหุนามในรูปแบบเมทริกซ์ได้:
นิพจน์เมทริกซ์ด้านบนสามารถเขียนใหม่ได้โดยกำหนดตัวอักษรให้กับแต่ละเมทริกซ์:
ดังนั้น เมื่อใช้ เกณฑ์กำลังสองน้อยที่สุด เราจะได้ สูตรสำหรับการประมาณค่าสัมประสิทธิ์ของแบบจำลองการถดถอยพหุนาม :
อย่างไรก็ตาม การคำนวณด้วยมือต้องใช้ความพยายามมากและใช้เวลานาน ดังนั้นจึงสะดวกกว่าในการใช้ซอฟต์แวร์คอมพิวเตอร์ (เช่น Minitab หรือ Excel) ซึ่งช่วยให้คุณดำเนินการแบบจำลองการถดถอยพหุนามได้เร็วขึ้นมาก
ตัวอย่างแบบจำลองการถดถอยพหุนาม
ตอนนี้เรารู้คำจำกัดความของการถดถอยพหุนามและวิธีการดำเนินการแล้ว เรามาดูตัวอย่างในชีวิตจริงเพื่อทำความเข้าใจแนวคิดนี้อย่างถ่องแท้กันดีกว่า
ประการแรก ควรจำไว้ว่าควรใช้แบบจำลองการถดถอยพหุนามเมื่อกราฟข้อมูลมีรูปร่างเป็นเส้นโค้งพหุนาม ตัวอย่างเช่น หากดอทพล็อตอยู่ในรูปของเส้นโค้งลูกบาศก์ เราจำเป็นต้องสร้างแบบจำลองการถดถอยพหุนามระดับที่สาม
อย่างที่คุณเห็นในภาพต่อไปนี้ ดอทพล็อตของข้อมูลของเรามีรูปร่างเป็นกำลังสอง เพราะเมื่อเราเพิ่มค่าของตัวแปรอิสระ ตัวแปรตามจะโตเร็วขึ้น ในกรณีนี้ มีการดำเนินการแบบจำลองการถดถอยเชิงเส้น และอย่างที่คุณเห็นว่ามันไม่พอดีกับจุดต่างๆ มากนัก เนื่องจากมีส่วนที่เส้นอยู่ต่ำกว่าจุดทั้งหมด และส่วนที่เส้นอยู่เหนือจุดเหล่านั้น
ในทางกลับกัน หากเราใช้แบบจำลองการถดถอยพหุนามกำลังสอง มันจะเหมาะกับข้อมูลตัวอย่างมากขึ้น ดังที่คุณเห็นในภาพด้านล่าง
นอกจากนี้ เมื่อพัฒนาแบบจำลองการถดถอยพหุนาม ค่าสัมประสิทธิ์การกำหนดจะดีขึ้นอย่างมากเนื่องจากเปลี่ยนจาก 86.80% เป็น 94.05% ดังนั้นโมเดลการถดถอยใหม่จึงอธิบายชุดข้อมูลได้ดีขึ้นมาก
ในทางกลับกัน สิ่งบ่งชี้อีกประการหนึ่งที่ว่าเราจำเป็นต้องทำการถดถอยพหุนามก็คือการวางแผนค่าคงเหลือ หากในการถดถอยเชิงเส้น กราฟของส่วนที่เหลือมีรูปร่างของพาราโบลาหรือพหุนามประเภทอื่น แบบจำลองการถดถอยพหุนามจะเหมาะกับข้อมูลที่ศึกษาดีกว่าอย่างแน่นอน
การถดถอยแบบไม่เชิงเส้นประเภทอื่น
การถดถอยแบบไม่เชิงเส้นมีสามประเภทหลักๆ:
- การถดถอยพหุนาม – สมการแบบจำลองการถดถอยอยู่ในรูปแบบของพหุนาม
- การถดถอยลอการิทึม : ใช้ลอการิทึมของตัวแปรอิสระ
- การถดถอยเอ็กซ์โพเนนเชียล : พบตัวแปรอิสระในเลขชี้กำลังของสมการ