วิธีการตีความค่าสัมประสิทธิ์การถดถอยโลจิสติก (พร้อมตัวอย่าง)
การถดถอยแบบลอจิสติก เป็นวิธีการที่เราสามารถใช้เพื่อให้พอดีกับแบบจำลองการถดถอยเมื่อ ตัวแปรตอบสนอง เป็นไบนารี
เมื่อเราปรับแบบจำลองการถดถอยโลจิสติกให้เหมาะสม ค่าสัมประสิทธิ์ของผลลัพธ์ของแบบจำลองแสดงถึง การเปลี่ยนแปลงโดยเฉลี่ยในโอกาสบันทึก ของตัวแปรตอบสนองที่เกี่ยวข้องกับการเพิ่มขึ้นหนึ่งหน่วยในตัวแปรทำนาย
β = Average Change in Log Odds of Response Variable
เรามักต้องการเข้าใจ การเปลี่ยนแปลงโดยเฉลี่ยในความน่าจะเป็น ของตัวแปรตอบสนองที่เกี่ยวข้องกับการเพิ่มขึ้นของตัวแปรทำนายหนึ่งหน่วย ซึ่งเราสามารถหาได้โดยใช้สูตร e β
e β = Average Change in Odds of Response Variable
ตัวอย่างต่อไปนี้แสดงวิธีการตีความค่าสัมประสิทธิ์การถดถอยโลจิสติกในทางปฏิบัติ
ตัวอย่าง: วิธีการตีความค่าสัมประสิทธิ์การถดถอยโลจิสติก
สมมติว่าเราต้องการปรับโมเดลการถดถอยลอจิสติกโดยใช้ เพศ และ จำนวนข้อสอบฝึกหัด เพื่อคาดการณ์ว่านักเรียนจะผ่านการสอบปลายภาคในชั้นเรียนหรือไม่
สมมติว่าเราปรับโมเดลโดยใช้ซอฟต์แวร์ทางสถิติ (เช่น R, Python , Excel หรือ SAS ) และได้รับผลลัพธ์ต่อไปนี้:
| การประมาณค่าสัมประสิทธิ์ | มาตรฐานบกพร่อง | ค่า Z | ค่า P | |
|---|---|---|---|---|
| สกัดกั้น | -1.34 | 0.23 | 5.83 | <0.001 |
| เพศชาย) | -0.56 | 0.25 | 2.24 | 0.03 |
| ข้อสอบภาคปฏิบัติ | 1.13 | 0.43 | 2.63 | 0.01 |
วิธีการตีความเพศ (ตัวแปรทำนายไบนารี)
เราจะเห็นได้ว่าการประมาณค่าสัมประสิทธิ์ เพศ เป็นลบ แสดงว่าการเป็นชายจะลดโอกาสสอบผ่าน
นอกจากนี้เรายังเห็นว่าค่า p ของเพศน้อยกว่า 0.05 ซึ่งหมายความว่ามีค่า P-Value อย่างมีนัยสำคัญทางสถิติว่าบุคคลจะผ่านการสอบหรือไม่
เพื่อให้เข้าใจได้อย่างแน่ชัดว่าการเป็นผู้ชายส่งผลต่อการผ่านการสอบหรือไม่ เราสามารถใช้สูตร e β ได้
อี -0.56 = 0.57
เราตีความสิ่งนี้ว่าหมายความว่าผู้ชายมีโอกาสสอบผ่านมากกว่าผู้หญิงเพียง 0.57 เท่า โดยถือว่าจำนวนข้อสอบฝึกหัดคงที่
นอกจากนี้เรายังอาจกล่าวได้ว่าผู้ชายมี โอกาสสอบผ่านน้อยกว่าผู้หญิง (1 – 0.57) 43% และสมมติว่าจำนวนข้อสอบฝึกหัดคงที่
วิธีตีความข้อสอบภาคปฏิบัติ (ตัวแปรทำนายต่อเนื่อง)
เราจะเห็นว่าการประมาณค่าสัมประสิทธิ์สำหรับ การสอบภาคปฏิบัติ เป็นค่าบวก ซึ่งบ่งชี้ว่าการสอบภาคปฏิบัติเพิ่มเติมแต่ละครั้งจะเพิ่มโอกาสในการสอบปลายภาค
เรายังเห็นได้ว่าค่า p สำหรับจำนวนข้อสอบฝึกหัดที่ทำน้อยกว่า 0.05 ซึ่งหมายความว่ามีค่า p-value อย่างมีนัยสำคัญทางสถิติว่าแต่ละคนจะผ่านการสอบปลายภาคหรือไม่
ในการหาปริมาณผลกระทบของการสอบภาคปฏิบัติเพิ่มเติมแต่ละครั้งต่อว่าแต่ละคนจะผ่านการสอบปลายภาคหรือไม่ เราสามารถใช้สูตร e β
อี 1.13 = 3.09
เราตีความสิ่งนี้ว่าหมายความว่าการสอบภาคปฏิบัติเพิ่มเติมแต่ละครั้งจะเพิ่มโอกาสในการผ่านการสอบปลายภาค 3.09 โดยสมมติว่าเพศคงที่
นอกจากนี้เรายังอาจกล่าวได้ว่าแบบฝึกหัดฝึกหัดเพิ่มเติมแต่ละครั้งมีความเกี่ยวข้องกับ โอกาสที่จะผ่านการสอบปลายภาคเพิ่มขึ้น (3.09 – 1) 209% และ สมมติว่าเพศยังคงที่
หมายเหตุ : โปรดดู บทความนี้ เพื่อเรียนรู้วิธีตีความคำศัพท์ดั้งเดิมในแบบจำลองการถดถอยโลจิสติก
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับการถดถอยโลจิสติก:
วิธีรายงานผลการถดถอยโลจิสติก
ทำความเข้าใจสมมติฐานว่างสำหรับการถดถอยโลจิสติก
ความแตกต่างระหว่างการถดถอยโลจิสติกและการถดถอยเชิงเส้น