Anova กับการถดถอย: อะไรคือความแตกต่าง?
แบบจำลองที่ใช้กันทั่วไปในสถิติมีอยู่ 2 แบบคือ ANOVA และแบบจำลองการถดถอย
โมเดลทั้งสองประเภทนี้มี ความคล้ายคลึงกันดังต่อไปนี้:
- ตัวแปรตอบสนอง ในแต่ละรุ่นมีความต่อเนื่อง ตัวอย่างของตัวแปรต่อเนื่อง ได้แก่ น้ำหนัก ส่วนสูง ความยาว ความกว้าง เวลา อายุ เป็นต้น
อย่างไรก็ตาม โมเดลทั้งสองประเภทนี้มี ความแตกต่างกัน ดังต่อไปนี้:
- แบบจำลอง ANOVA จะใช้เมื่อตัวแปรทำนายมีการจัดหมวดหมู่ ตัวอย่างของตัวแปรเชิงหมวดหมู่ ได้แก่ ระดับการศึกษา สีตา สถานภาพการสมรส ฯลฯ
- แบบจำลองการถดถอยจะใช้เมื่อตัวแปรทำนายมีความต่อเนื่อง*
*แบบจำลองการถดถอยสามารถใช้กับตัวแปรทำนายเชิงหมวดหมู่ได้ แต่เราจำเป็นต้องสร้าง ตัวแปรจำลอง เพื่อใช้พวกมัน
ตัวอย่างต่อไปนี้จะแสดงว่าเมื่อใดควรใช้แบบจำลอง ANOVA หรือแบบจำลองการถดถอยในทางปฏิบัติ
ตัวอย่างที่ 1: โมเดล ANOVA ที่ต้องการ
สมมติว่านักชีววิทยาต้องการเข้าใจว่าปุ๋ยสี่ชนิดที่แตกต่างกันทำให้พืชมีการเจริญเติบโตโดยเฉลี่ยเท่ากัน (หน่วยเป็นนิ้ว) ในช่วงเวลาหนึ่งเดือนหรือไม่ เพื่อทดสอบสิ่งนี้ เธอใส่ปุ๋ยแต่ละต้นกับต้น 20 ต้นและบันทึกการเติบโตของต้นแต่ละต้นหลังจากผ่านไปหนึ่งเดือน
ในสถานการณ์นี้ นักชีววิทยาต้องใช้แบบจำลองการวิเคราะห์ความแปรปรวนแบบทางเดียวเพื่อวิเคราะห์ความแตกต่างระหว่างปุ๋ย เนื่องจากมีตัวแปรทำนายและเป็นหมวดหมู่
กล่าวอีกนัยหนึ่ง ค่าของตัวแปรทำนายสามารถจำแนกได้เป็น “หมวดหมู่” ต่อไปนี้:
- ปุ๋ย 1
- ปุ๋ย 2
- ปุ๋ย 3
- ปุ๋ย 4
การวิเคราะห์ความแปรปรวนแบบทางเดียวจะบอกนักชีววิทยาว่าการเจริญเติบโตของพืชโดยเฉลี่ยจะเท่ากันหรือไม่ระหว่างปุ๋ยทั้ง 4 ชนิด
ตัวอย่างที่ 2: โมเดลการถดถอยที่ต้องการ
สมมติว่าตัวแทนอสังหาริมทรัพย์ต้องการทำความเข้าใจความสัมพันธ์ระหว่างพื้นที่เป็นตารางฟุตและราคาอสังหาริมทรัพย์ เพื่อวิเคราะห์ความสัมพันธ์นี้ เขารวบรวมข้อมูลในพื้นที่เป็นตารางฟุตและราคาของบ้าน 200 หลังในเมืองหนึ่งๆ
ในสถานการณ์นี้ ตัวแทนอสังหาริมทรัพย์ควรใช้แบบจำลองการถดถอยเชิงเส้นอย่างง่ายเพื่อวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรทั้งสองนี้ เนื่องจากตัวแปรทำนาย (ตารางฟุต) มีความต่อเนื่อง
การใช้การถดถอยเชิงเส้นอย่างง่าย ตัวแทนอสังหาริมทรัพย์สามารถใส่แบบจำลองการถดถอยต่อไปนี้:
ราคาอสังหาริมทรัพย์ = β 0 + β 1 (พื้นที่สี่เหลี่ยม)
ค่า β 1 จะแสดงถึงการเปลี่ยนแปลงโดยเฉลี่ยของราคาบ้านที่เกี่ยวข้องกับแต่ละตารางฟุตเพิ่มเติม
ซึ่งจะช่วยให้ตัวแทนอสังหาริมทรัพย์สามารถระบุความสัมพันธ์ระหว่างพื้นที่เป็นตารางฟุตและราคาทรัพย์สินได้
ตัวอย่างที่ 3: โมเดลการถดถอยพร้อมตัวแปรจำลองที่ต้องการ
สมมติว่าตัวแทนอสังหาริมทรัพย์ต้องการทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรทำนาย “พื้นที่เป็นตารางฟุต” และ “ประเภทบ้าน” (ครอบครัวเดี่ยว อพาร์ทเมนต์ ทาวน์เฮาส์) กับตัวแปรตอบสนองของราคาอสังหาริมทรัพย์
ในสถานการณ์สมมตินี้ ตัวแทนอสังหาริมทรัพย์สามารถใช้การถดถอยเชิงเส้นหลายรายการโดยการแปลง “ประเภทบ้าน” เป็นตัวแปรจำลอง เนื่องจากในปัจจุบันเป็นตัวแปรประเภท
ตัวแทนอสังหาริมทรัพย์สามารถติดตั้งแบบจำลองการถดถอยเชิงเส้นหลายแบบต่อไปนี้:
ราคาอสังหาริมทรัพย์ = β 0 + β 1 (พื้นที่สี่เหลี่ยม) + β 2 (ครอบครัวเดี่ยว) + β 3 (อพาร์ตเมนต์)
นี่คือวิธีที่เราจะตีความค่าสัมประสิทธิ์ของโมเดล:
- β 1 : การเปลี่ยนแปลงโดยเฉลี่ยของราคาบ้านที่เกี่ยวข้องกับการเพิ่มอีกหนึ่งตารางฟุต
- β 2 : ส่วนต่างราคาเฉลี่ยระหว่างบ้านเดี่ยวและทาวน์เฮาส์ โดยสมมติว่าพื้นที่เป็นตารางฟุตคงที่
- β 3 : ส่วนต่างราคาเฉลี่ยระหว่างบ้านเดี่ยวและอพาร์ตเมนต์ โดยสมมติว่ามีพื้นที่ผิวคงที่
ดูบทช่วยสอนต่อไปนี้เพื่อดูวิธีสร้างตัวแปรจำลองในซอฟต์แวร์ทางสถิติต่างๆ:
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้ให้ข้อมูลเบื้องต้นเชิงลึกเกี่ยวกับโมเดล ANOVA:
- ข้อมูลเบื้องต้นเกี่ยวกับการวิเคราะห์ความแปรปรวนแบบทางเดียว
- ข้อมูลเบื้องต้นเกี่ยวกับการวิเคราะห์ความแปรปรวนแบบสองทาง
บทช่วยสอนต่อไปนี้ให้ข้อมูลเบื้องต้นเชิงลึกเกี่ยวกับโมเดลการถดถอยเชิงเส้น: