วิธีตีความการสกัดกั้นในแบบจำลองการถดถอย: พร้อมตัวอย่าง
จุดตัด (บางครั้งเรียกว่า “ค่าคงที่”) ในแบบจำลองการถดถอยแสดงถึงค่าเฉลี่ยของตัวแปรตอบสนอง เมื่อตัวแปรตัวทำนายทั้งหมดในแบบจำลองมีค่าเท่ากับศูนย์
บทช่วยสอนนี้จะอธิบายวิธีการตีความค่าดั้งเดิมในการถดถอยเชิงเส้นอย่างง่ายและแบบจำลองการถดถอยเชิงเส้นหลายตัว
การตีความจุดตัดในการถดถอยเชิงเส้นอย่างง่าย
แบบจำลองการถดถอยเชิงเส้นอย่างง่ายมีรูปแบบดังต่อไปนี้:
ŷ = β 0 + β 1 (x)
ทอง:
- ŷ: ค่าที่ทำนายไว้สำหรับตัวแปรตอบสนอง
- β 0 : ค่าเฉลี่ยของตัวแปรตอบสนองเมื่อ x = 0
- β 1 : การเปลี่ยนแปลงโดยเฉลี่ยในตัวแปรตอบสนองสำหรับการเพิ่ม x หนึ่งหน่วย
- x: ค่าของตัวแปรทำนาย
ในบางกรณี การตีความค่าจุดตัดในแบบจำลองการถดถอยเชิงเส้นอย่างง่าย แต่ก็ไม่เสมอไป ตัวอย่างต่อไปนี้แสดงให้เห็นสิ่งนี้
ตัวอย่างที่ 1: การสกัดกั้นสมเหตุสมผลในการตีความ
สมมติว่าเราต้องการปรับโมเดลการถดถอยเชิงเส้นอย่างง่ายโดยใช้ ชั่วโมงที่ศึกษา เป็นตัวแปรทำนายและ คะแนนสอบ เป็นตัวแปรตอบสนอง
เรารวบรวมข้อมูลนี้สำหรับนักศึกษา 50 คนในหลักสูตรของมหาวิทยาลัยหนึ่งๆ และสอดคล้องกับโมเดลการถดถอยต่อไปนี้:
คะแนนสอบ = 65.4 + 2.67 (ชั่วโมง)
ค่าของคำศัพท์ดั้งเดิมในโมเดลนี้คือ 65.4 ซึ่งหมายความว่าคะแนนสอบเฉลี่ยคือ 65.4 เมื่อจำนวนชั่วโมงเรียนเป็นศูนย์
สิ่งนี้สมเหตุสมผลที่จะตีความเนื่องจากเป็นไปได้ที่นักเรียนจะเรียนเป็นเวลาศูนย์เพื่อการสอบ
ตัวอย่างที่ 2: การสกัดกั้นไม่สมเหตุสมผลที่จะตีความ
สมมติว่าเรา ต้องการปรับโมเดลการถดถอยเชิงเส้นอย่างง่ายโดยใช้ น้ำหนัก (เป็นปอนด์) เป็นตัวแปรทำนาย และ ใช้ความสูง (เป็นนิ้ว) เป็นตัวแปรตอบสนอง
เรารวบรวมข้อมูลนี้สำหรับบุคคล 50 คน และใช้แบบจำลองการถดถอยต่อไปนี้:
ส่วนสูง = 22.3 + 0.28 (ปอนด์)
ค่าของคำศัพท์ดั้งเดิมในโมเดลนี้คือ 22.3 ซึ่งหมายความว่าความสูงของคนโดยเฉลี่ยคือ 22.3 นิ้วเมื่อน้ำหนักเป็นศูนย์
สิ่งนี้ไม่สมเหตุสมผลที่จะตีความเนื่องจากเป็นไปไม่ได้ที่บุคคลจะมีน้ำหนักเป็นศูนย์ปอนด์
อย่างไรก็ตาม เรายังจำเป็นต้องเก็บคำดั้งเดิมไว้ในแบบจำลอง เพื่อที่เราจะได้ใช้แบบจำลองในการทำนายได้ การสกัดกั้นไม่มีการตีความที่มีความหมายสำหรับรุ่นนี้
การตีความการสกัดกั้นในการถดถอยเชิงเส้นพหุคูณ
โมเดลการถดถอยเชิงเส้นพหุคูณมีรูปแบบดังต่อไปนี้:
ŷ = β 0 + β 1 (x 1 ) + β 2 (x 2 ) + β 3 (x 3 ) + … + β k (x k )
ทอง:
- ŷ: ค่าที่ทำนายไว้สำหรับตัวแปรตอบสนอง
- β 0 : ค่าเฉลี่ยของตัวแปรตอบสนองเมื่อตัวแปรทำนายทั้งหมดเป็นศูนย์
- β j : การเปลี่ยนแปลงโดยเฉลี่ยในตัวแปรตอบสนองสำหรับการเพิ่มหนึ่งหน่วยในตัวแปรตัวทำนาย ที่ j โดยสมมติว่าตัวแปรตัวทำนายอื่นทั้งหมดคงที่
- x j : ค่าของตัวแปรทำนาย ที่ j
เช่นเดียวกับการถดถอยเชิงเส้นอย่างง่าย บางครั้งการตีความค่าจุดตัดในแบบจำลองการถดถอยเชิงเส้นพหุคูณก็สมเหตุสมผล แต่ก็ไม่เสมอไป ตัวอย่างต่อไปนี้แสดงให้เห็นสิ่งนี้
ตัวอย่างที่ 1: การสกัดกั้นสมเหตุสมผลในการตีความ
สมมติว่าเราต้องการปรับโมเดลการถดถอยเชิงเส้นพหุคูณโดยใช้ ชั่วโมงการศึกษา และ การสอบเตรียมการที่ ใช้เป็นตัวแปรทำนายและ คะแนนการสอบ เป็นตัวแปรตอบสนอง
เรารวบรวมข้อมูลนี้สำหรับนักศึกษา 50 คนในหลักสูตรของมหาวิทยาลัยหนึ่งๆ และสอดคล้องกับโมเดลการถดถอยต่อไปนี้:
คะแนนสอบ = 58.4 + 2.23 (ชม.) + 1.34 (จำนวนข้อสอบเตรียมอุดมศึกษา)
ค่าของคำศัพท์ดั้งเดิมในโมเดลนี้คือ 58.4 ซึ่งหมายความว่าคะแนนสอบเฉลี่ยอยู่ที่ 58.4 เมื่อจำนวนชั่วโมงที่เรียนและจำนวนการสอบเพื่อเตรียมตัวเท่ากับศูนย์
สิ่งนี้สมเหตุสมผลที่จะตีความเนื่องจากเป็นไปได้ที่นักเรียนจะเรียนเป็นเวลาศูนย์ชั่วโมงและไม่ต้องทำข้อสอบเตรียมความพร้อมก่อนการสอบ
ตัวอย่างที่ 2: การสกัดกั้นไม่สมเหตุสมผลที่จะตีความ
สมมติว่าเราต้องการปรับโมเดลการถดถอยเชิงเส้นหลายตัวโดยใช้ พื้นที่เป็นตารางฟุต และ จำนวนห้องนอน เป็นตัวแปรทำนาย และ ราคาขาย เป็นตัวแปรตอบสนอง
เรารวบรวมข้อมูลนี้สำหรับบ้าน 100 หลังในเมืองหนึ่ง และใช้แบบจำลองการถดถอยต่อไปนี้:
ราคา = 87,244 + 3.44 (ตารางฟุต) + 843.45 (จำนวนห้องนอน)
ค่าของคำศัพท์ดั้งเดิมในโมเดลนี้คือ 87.244 ซึ่งหมายความว่าราคาขายบ้านโดยเฉลี่ยอยู่ที่ 87,244 ดอลลาร์ เมื่อพื้นที่เป็นตารางฟุตของบ้านและจำนวนห้องนอนมีค่าเท่ากับศูนย์
สิ่งนี้ไม่สมเหตุสมผลที่จะตีความเนื่องจากเป็นไปไม่ได้ที่บ้านจะมีพื้นที่เป็นตารางฟุตและไม่มีห้องนอน
อย่างไรก็ตาม เรายังจำเป็นต้องเก็บคำดั้งเดิมไว้ในแบบจำลองเพื่อใช้ในการคาดการณ์ การสกัดกั้นไม่มีการตีความที่มีความหมายสำหรับรุ่นนี้
แหล่งข้อมูลเพิ่มเติม
รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นอย่างง่าย
รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นพหุคูณ
วิธีการตีความค่าสัมประสิทธิ์การถดถอยบางส่วน