Anova กับการถดถอย: อะไรคือความแตกต่าง?


แบบจำลองที่ใช้กันทั่วไปในสถิติมีอยู่ 2 แบบคือ ANOVA และแบบจำลองการถดถอย

โมเดลทั้งสองประเภทนี้มี ความคล้ายคลึงกันดังต่อไปนี้:

  • ตัวแปรตอบสนอง ในแต่ละรุ่นมีความต่อเนื่อง ตัวอย่างของตัวแปรต่อเนื่อง ได้แก่ น้ำหนัก ส่วนสูง ความยาว ความกว้าง เวลา อายุ เป็นต้น

อย่างไรก็ตาม โมเดลทั้งสองประเภทนี้มี ความแตกต่างกัน ดังต่อไปนี้:

  • แบบจำลอง ANOVA จะใช้เมื่อตัวแปรทำนายมีการจัดหมวดหมู่ ตัวอย่างของตัวแปรเชิงหมวดหมู่ ได้แก่ ระดับการศึกษา สีตา สถานภาพการสมรส ฯลฯ
  • แบบจำลองการถดถอยจะใช้เมื่อตัวแปรทำนายมีความต่อเนื่อง*

*แบบจำลองการถดถอยสามารถใช้กับตัวแปรทำนายเชิงหมวดหมู่ได้ แต่เราจำเป็นต้องสร้าง ตัวแปรจำลอง เพื่อใช้พวกมัน

ตัวอย่างต่อไปนี้จะแสดงว่าเมื่อใดควรใช้แบบจำลอง ANOVA หรือแบบจำลองการถดถอยในทางปฏิบัติ

ตัวอย่างที่ 1: โมเดล ANOVA ที่ต้องการ

สมมติว่านักชีววิทยาต้องการเข้าใจว่าปุ๋ยสี่ชนิดที่แตกต่างกันทำให้พืชมีการเจริญเติบโตโดยเฉลี่ยเท่ากัน (หน่วยเป็นนิ้ว) ในช่วงเวลาหนึ่งเดือนหรือไม่ เพื่อทดสอบสิ่งนี้ เธอใส่ปุ๋ยแต่ละต้นกับต้น 20 ต้นและบันทึกการเติบโตของต้นแต่ละต้นหลังจากผ่านไปหนึ่งเดือน

ในสถานการณ์นี้ นักชีววิทยาต้องใช้แบบจำลองการวิเคราะห์ความแปรปรวนแบบทางเดียวเพื่อวิเคราะห์ความแตกต่างระหว่างปุ๋ย เนื่องจากมีตัวแปรทำนายและเป็นหมวดหมู่

กล่าวอีกนัยหนึ่ง ค่าของตัวแปรทำนายสามารถจำแนกได้เป็น “หมวดหมู่” ต่อไปนี้:

  • ปุ๋ย 1
  • ปุ๋ย 2
  • ปุ๋ย 3
  • ปุ๋ย 4

การวิเคราะห์ความแปรปรวนแบบทางเดียวจะบอกนักชีววิทยาว่าการเจริญเติบโตของพืชโดยเฉลี่ยจะเท่ากันหรือไม่ระหว่างปุ๋ยทั้ง 4 ชนิด

ตัวอย่างที่ 2: โมเดลการถดถอยที่ต้องการ

สมมติว่าตัวแทนอสังหาริมทรัพย์ต้องการทำความเข้าใจความสัมพันธ์ระหว่างพื้นที่เป็นตารางฟุตและราคาอสังหาริมทรัพย์ เพื่อวิเคราะห์ความสัมพันธ์นี้ เขารวบรวมข้อมูลในพื้นที่เป็นตารางฟุตและราคาของบ้าน 200 หลังในเมืองหนึ่งๆ

ในสถานการณ์นี้ ตัวแทนอสังหาริมทรัพย์ควรใช้แบบจำลองการถดถอยเชิงเส้นอย่างง่ายเพื่อวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรทั้งสองนี้ เนื่องจากตัวแปรทำนาย (ตารางฟุต) มีความต่อเนื่อง

การใช้การถดถอยเชิงเส้นอย่างง่าย ตัวแทนอสังหาริมทรัพย์สามารถใส่แบบจำลองการถดถอยต่อไปนี้:

ราคาอสังหาริมทรัพย์ = β 0 + β 1 (พื้นที่สี่เหลี่ยม)

ค่า β 1 จะแสดงถึงการเปลี่ยนแปลงโดยเฉลี่ยของราคาบ้านที่เกี่ยวข้องกับแต่ละตารางฟุตเพิ่มเติม

ซึ่งจะช่วยให้ตัวแทนอสังหาริมทรัพย์สามารถระบุความสัมพันธ์ระหว่างพื้นที่เป็นตารางฟุตและราคาทรัพย์สินได้

ตัวอย่างที่ 3: โมเดลการถดถอยพร้อมตัวแปรจำลองที่ต้องการ

สมมติว่าตัวแทนอสังหาริมทรัพย์ต้องการทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรทำนาย “พื้นที่เป็นตารางฟุต” และ “ประเภทบ้าน” (ครอบครัวเดี่ยว อพาร์ทเมนต์ ทาวน์เฮาส์) กับตัวแปรตอบสนองของราคาอสังหาริมทรัพย์

ในสถานการณ์สมมตินี้ ตัวแทนอสังหาริมทรัพย์สามารถใช้การถดถอยเชิงเส้นหลายรายการโดยการแปลง “ประเภทบ้าน” เป็นตัวแปรจำลอง เนื่องจากในปัจจุบันเป็นตัวแปรประเภท

ตัวแทนอสังหาริมทรัพย์สามารถติดตั้งแบบจำลองการถดถอยเชิงเส้นหลายแบบต่อไปนี้:

ราคาอสังหาริมทรัพย์ = β 0 + β 1 (พื้นที่สี่เหลี่ยม) + β 2 (ครอบครัวเดี่ยว) + β 3 (อพาร์ตเมนต์)

นี่คือวิธีที่เราจะตีความค่าสัมประสิทธิ์ของโมเดล:

  • β 1 : การเปลี่ยนแปลงโดยเฉลี่ยของราคาบ้านที่เกี่ยวข้องกับการเพิ่มอีกหนึ่งตารางฟุต
  • β 2 : ส่วนต่างราคาเฉลี่ยระหว่างบ้านเดี่ยวและทาวน์เฮาส์ โดยสมมติว่าพื้นที่เป็นตารางฟุตคงที่
  • β 3 : ส่วนต่างราคาเฉลี่ยระหว่างบ้านเดี่ยวและอพาร์ตเมนต์ โดยสมมติว่ามีพื้นที่ผิวคงที่

ดูบทช่วยสอนต่อไปนี้เพื่อดูวิธีสร้างตัวแปรจำลองในซอฟต์แวร์ทางสถิติต่างๆ:

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเบื้องต้นเชิงลึกเกี่ยวกับโมเดล ANOVA:

บทช่วยสอนต่อไปนี้ให้ข้อมูลเบื้องต้นเชิงลึกเกี่ยวกับโมเดลการถดถอยเชิงเส้น:

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *