วิธีการตีความค่าสัมประสิทธิ์การถดถอย
ในสถิติ การวิเคราะห์การถดถอย เป็นเทคนิคที่สามารถใช้เพื่อวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรทำนายและตัวแปรตอบสนอง
เมื่อคุณใช้ซอฟต์แวร์ (เช่น R , Stata , SPSS ฯลฯ ) เพื่อทำการวิเคราะห์การถดถอย คุณจะได้รับตารางการถดถอยที่สรุปผลการถดถอยเป็นเอาต์พุต
ตัวเลขที่สำคัญที่สุดในผลลัพธ์ของตารางการถดถอยอาจเป็น ค่าสัมประสิทธิ์การถดถอย แม้จะมีความสำคัญ แต่หลายคนก็ยังพยายามตีความตัวเลขเหล่านี้ให้ถูกต้อง
บทช่วยสอนนี้นำเสนอตัวอย่างการวิเคราะห์การถดถอยและให้คำอธิบายโดยละเอียดเกี่ยวกับวิธีการตีความค่าสัมประสิทธิ์การถดถอยที่เป็นผลมาจากการถดถอย
ที่เกี่ยวข้อง: วิธีอ่านและตีความตารางการถดถอยทั้งหมด
ตัวอย่างการวิเคราะห์การถดถอย
สมมติว่าเราต้องการทำการ วิเคราะห์การถดถอยโดยใช้ตัวแปรต่อไปนี้:
ตัวแปรทำนาย
- จำนวนชั่วโมงที่ศึกษาทั้งหมด ( ตัวแปรต่อเนื่อง – ระหว่าง 0 ถึง 20 )
- นักเรียนใช้ติวเตอร์หรือไม่ ( ตัวแปรหมวดหมู่ – “ใช่” หรือ “ไม่ใช่” )
ตัวแปรตอบสนอง
- คะแนนสอบ ( ตัวแปร ต่อเนื่อง – ระหว่าง 1 ถึง 100 )
เราต้องการตรวจสอบความสัมพันธ์ระหว่างตัวแปรทำนายและตัวแปรตอบสนองเพื่อดูว่าชั่วโมงเรียนและนักเรียนที่ใช้ติวเตอร์มีผลกระทบสำคัญต่อคะแนนสอบหรือไม่
สมมติว่าเราทำการวิเคราะห์การถดถอยและได้ผลลัพธ์ดังต่อไปนี้:
ภาคเรียน | ค่าสัมประสิทธิ์ | มาตรฐานบกพร่อง | สถิติ | ค่า P |
---|---|---|---|---|
สกัดกั้น | 48.56 | 14:32 น. | 3.39 | 0.002 |
ชั่วโมงการศึกษา | 2.03 | 0.67 | 3.03 | 0.009 |
ติวเตอร์ | 8.34 | 5.68 | 1.47 | 0.138 |
เรามาดูวิธีการตีความค่าสัมประสิทธิ์การถดถอยแต่ละค่ากัน
การตีความการสกัดกั้น
คำ ดั้งเดิม ในตารางการถดถอยบอกเราถึงค่าเฉลี่ยที่คาดหวังสำหรับตัวแปรตอบสนอง เมื่อตัวแปรตัวทำนายทั้งหมดมีค่าเท่ากับศูนย์
ในตัวอย่างนี้ ค่าสัมประสิทธิ์การถดถอยสำหรับจุดกำเนิดจะเท่ากับ 48.56 ซึ่งหมายความว่าสำหรับนักเรียนที่เรียนเป็นศูนย์ชั่วโมง ( ชั่วโมงเรียน = 0) และไม่ได้ใช้ติวเตอร์ ( ติวเตอร์ = 0) คะแนนสอบเฉลี่ยที่คาดหวังคือ 48.56
สิ่งสำคัญคือต้องทราบว่าค่าสัมประสิทธิ์การถดถอยสำหรับจุดตัดแกนจะมีนัยสำคัญก็ต่อเมื่อมีเหตุผลสมควรที่ตัวแปรทำนายทั้งหมดในแบบจำลองจะเท่ากับศูนย์ได้จริง ในตัวอย่างนี้ เป็นไปได้อย่างแน่นอนว่านักเรียนเรียนเป็นศูนย์ชั่วโมง ( ชั่วโมงที่เรียน = 0) และไม่ได้ใช้ติวเตอร์ด้วย ( กวดวิชา = 0) ดังนั้นการตีความค่าสัมประสิทธิ์การถดถอยของจุดตัดจึงมีความหมายในตัวอย่างนี้
อย่างไรก็ตาม ในบางกรณี ค่าสัมประสิทธิ์การถดถอยสำหรับการสกัดกั้นไม่มีนัยสำคัญ ตัวอย่างเช่น สมมติว่าเราทำการวิเคราะห์การถดถอยโดยใช้ พื้นที่เป็นตารางฟุต เป็นตัวแปรทำนายและ ค่าโฮม เป็นตัวแปรตอบสนอง
ในตารางการถดถอยเอาท์พุท ค่าสัมประสิทธิ์การถดถอยสำหรับคำเดิมจะไม่มีการตีความที่มีความหมาย เนื่องจาก พื้นที่เป็นตารางฟุต ของบ้านไม่สามารถเท่ากับศูนย์ได้ ในกรณีนี้ ค่าสัมประสิทธิ์การถดถอยสำหรับคำดั้งเดิมจะยึดเส้นการถดถอยในตำแหน่งที่ถูกต้อง
การตีความค่าสัมประสิทธิ์ของตัวแปรทำนายต่อเนื่อง
สำหรับตัวแปรตัวทำนายแบบต่อเนื่อง ค่าสัมประสิทธิ์การถดถอยแสดงถึงความแตกต่างระหว่างค่าทำนายของตัวแปรตอบสนองสำหรับการเปลี่ยนแปลงแต่ละหน่วยในตัวแปรตัวทำนาย โดยถือว่าตัวแปรตัวทำนายอื่นๆ ทั้งหมดยังคงที่
ในตัวอย่างนี้ ชั่วโมงที่ศึกษา เป็นตัวแปรทำนายต่อเนื่องซึ่งมีช่วงตั้งแต่ 0 ถึง 20 ชั่วโมง ในบางกรณี นักเรียนเรียนเพียงศูนย์ชั่วโมง และในกรณีอื่นๆ นักเรียนเรียนสูงสุด 20 ชั่วโมง
จากผลการถดถอยเราจะเห็นว่าค่าสัมประสิทธิ์การถดถอยของ ชั่วโมงที่ศึกษา คือ 2.03 ซึ่งหมายความว่าโดยเฉลี่ยแล้ว แต่ละชั่วโมงที่ศึกษาเพิ่มเติมจะสัมพันธ์กับคะแนนสอบปลายภาคที่เพิ่มขึ้น 2.03 คะแนน โดยสมมติว่า ตัวแปรติวเตอร์ ตัวทำนายคงที่
ตัวอย่างเช่น ลองพิจารณานักเรียน A ที่เรียน 10 ชั่วโมงและใช้ติวเตอร์ ลองพิจารณานักเรียน B ที่เรียน 11 ชั่วโมงและใช้ติวเตอร์ด้วย จากผลการถดถอยของเรา คาดว่านักเรียน B จะทำคะแนนสอบได้สูงกว่านักเรียน A 2.03 คะแนน
ค่า p ของตารางการถดถอยบอกเราว่าสัมประสิทธิ์การถดถอยนี้มีนัยสำคัญทางสถิติจริงหรือไม่ เราจะเห็นว่าค่า p ของ ชั่วโมงที่ศึกษา คือ 0.009 ซึ่งมีนัยสำคัญทางสถิติที่ระดับอัลฟา 0.05
หมายเหตุ: ต้องเลือกระดับอัลฟ่าก่อนทำการวิเคราะห์การถดถอย ตัวเลือกทั่วไปสำหรับระดับอัลฟ่าคือ 0.01, 0.05 และ 0.10
บทความที่เกี่ยวข้อง: คำอธิบายค่า P และนัยสำคัญทางสถิติ
การตีความค่าสัมประสิทธิ์ของตัวแปรทำนายเชิงหมวดหมู่
สำหรับตัวแปรทำนายเชิงหมวดหมู่ ค่าสัมประสิทธิ์การถดถอยแสดงถึงความแตกต่างในค่าที่ทำนายของตัวแปรตอบสนองระหว่างหมวดหมู่ที่ตัวแปรทำนาย = 0 และหมวดหมู่ที่ตัวแปรทำนาย = 1
ในตัวอย่างนี้ Tutor เป็นตัวแปรทำนายเชิงหมวดหมู่ที่สามารถรับค่าที่แตกต่างกันได้สองค่า:
- 1 = นักเรียนใช้ติวเตอร์เพื่อเตรียมตัวสอบ
- 0 = นักเรียนไม่ได้ใช้ติวเตอร์เตรียมตัวสอบ
จากผลการถดถอย เราจะเห็นว่าค่าสัมประสิทธิ์การถดถอยของ ติวเตอร์ คือ 8.34 ซึ่งหมายความว่า โดยเฉลี่ยแล้ว นักเรียนที่ใช้ติวเตอร์ทำคะแนนในการสอบได้สูงกว่านักเรียนที่ไม่ได้ใช้ติวเตอร์ 8.34 คะแนน โดยถือว่าตัวแปร ชั่วโมงเรียน คงที่
ตัวอย่างเช่น ลองพิจารณานักเรียน A ที่เรียน 10 ชั่วโมงและใช้ติวเตอร์ นอกจากนี้ ให้พิจารณานักเรียน B ที่เรียน 10 ชั่วโมงและไม่ได้ใช้ติวเตอร์ด้วย จากผลการถดถอยของเรา คาดว่านักเรียน A จะมีคะแนนสอบสูงกว่านักเรียน B 8.34 คะแนน
ค่า p ของตารางการถดถอยบอกเราว่าสัมประสิทธิ์การถดถอยนี้มีนัยสำคัญทางสถิติจริงหรือไม่ เราจะเห็นว่าค่า p ของ Tutor คือ 0.138 ซึ่งไม่มีนัยสำคัญทางสถิติที่ระดับอัลฟ่าที่ 0.05 สิ่งนี้บ่งชี้ว่าแม้ว่านักเรียนที่ใช้ติวเตอร์จะสอบได้ดีกว่า แต่ความแตกต่างนี้อาจเนื่องมาจากโอกาส
ตีความสัมประสิทธิ์ทั้งหมดพร้อมกัน
เราสามารถใช้สัมประสิทธิ์ทั้งหมดในตารางการถดถอยเพื่อสร้างสมการการถดถอยโดยประมาณต่อไปนี้:
คะแนนสอบที่คาดหวัง = 48.56 + 2.03*(ชั่วโมงเรียน) + 8.34*(ติวเตอร์)
หมายเหตุ : โปรดทราบว่าตัวแปรตัวทำนาย “ติวเตอร์” ไม่มีนัยสำคัญทางสถิติที่ระดับอัลฟ่า 0.05 ดังนั้นคุณอาจเลือกที่จะลบตัวทำนายนี้ออกจากแบบจำลองและไม่ใช้มันในการประมาณค่าขั้นสุดท้ายของสมการถดถอย
เมื่อใช้สมการการถดถอยโดยประมาณนี้ เราสามารถทำนายคะแนนสอบปลายภาคของนักเรียนโดยพิจารณาจากจำนวนชั่วโมงเรียนทั้งหมด และพวกเขาใช้ครูสอนพิเศษหรือไม่
ตัวอย่างเช่น นักเรียนที่เรียน 10 ชั่วโมงและใช้ติวเตอร์ควรได้รับคะแนนสอบ:
คะแนนสอบที่คาดหวัง = 48.56 + 2.03*(10) + 8.34*(1) = 77.2
คำนึงถึงความสัมพันธ์เมื่อตีความค่าสัมประสิทธิ์การถดถอย
สิ่งสำคัญคือต้องจำไว้ว่าตัวแปรทำนายสามารถมีอิทธิพลซึ่งกันและกันในแบบจำลองการถดถอย ตัวอย่างเช่น ตัวแปรทำนายส่วนใหญ่จะมีความเกี่ยวข้องกันเป็นอย่างน้อย (เช่น นักเรียนที่เรียนมากกว่ามักจะใช้ติวเตอร์มากกว่า)
ซึ่งหมายความว่าค่าสัมประสิทธิ์การถดถอยจะเปลี่ยนไปเมื่อมีการเพิ่มหรือลบตัวแปรทำนายที่แตกต่างกันออกจากแบบจำลอง
วิธีที่ดีในการดูว่าความสัมพันธ์ระหว่างตัวแปรทำนายนั้นรุนแรงพอที่จะส่งผลต่อแบบจำลองการถดถอยอย่างจริงจังหรือไม่ คือการ ตรวจสอบ VIF ระหว่างตัวแปรทำนาย
วิธีนี้จะบอกคุณว่าความสัมพันธ์ระหว่างตัวแปรทำนายเป็นปัญหาที่ต้องแก้ไขก่อนตัดสินใจตีความค่าสัมประสิทธิ์การถดถอยหรือไม่
หากคุณรัน โมเดลการถดถอยเชิงเส้นอย่างง่าย ด้วยตัวทำนายตัวเดียว ตัวแปรตัวทำนายที่สัมพันธ์กันจะไม่เป็นปัญหา