วิธีการตีความค่าสัมประสิทธิ์การถดถอยโลจิสติก (พร้อมตัวอย่าง)


การถดถอยแบบลอจิสติก เป็นวิธีการที่เราสามารถใช้เพื่อให้พอดีกับแบบจำลองการถดถอยเมื่อ ตัวแปรตอบสนอง เป็นไบนารี

เมื่อเราปรับแบบจำลองการถดถอยโลจิสติกให้เหมาะสม ค่าสัมประสิทธิ์ของผลลัพธ์ของแบบจำลองแสดงถึง การเปลี่ยนแปลงโดยเฉลี่ยในโอกาสบันทึก ของตัวแปรตอบสนองที่เกี่ยวข้องกับการเพิ่มขึ้นหนึ่งหน่วยในตัวแปรทำนาย

 β = Average Change in Log Odds of Response Variable

เรามักต้องการเข้าใจ การเปลี่ยนแปลงโดยเฉลี่ยในความน่าจะเป็น ของตัวแปรตอบสนองที่เกี่ยวข้องกับการเพิ่มขึ้นของตัวแปรทำนายหนึ่งหน่วย ซึ่งเราสามารถหาได้โดยใช้สูตร e β

 e β = Average Change in Odds of Response Variable

ตัวอย่างต่อไปนี้แสดงวิธีการตีความค่าสัมประสิทธิ์การถดถอยโลจิสติกในทางปฏิบัติ

ตัวอย่าง: วิธีการตีความค่าสัมประสิทธิ์การถดถอยโลจิสติก

สมมติว่าเราต้องการปรับโมเดลการถดถอยลอจิสติกโดยใช้ เพศ และ จำนวนข้อสอบฝึกหัด เพื่อคาดการณ์ว่านักเรียนจะผ่านการสอบปลายภาคในชั้นเรียนหรือไม่

สมมติว่าเราปรับโมเดลโดยใช้ซอฟต์แวร์ทางสถิติ (เช่น R, Python , Excel หรือ SAS ) และได้รับผลลัพธ์ต่อไปนี้:

การประมาณค่าสัมประสิทธิ์ มาตรฐานบกพร่อง ค่า Z ค่า P
สกัดกั้น -1.34 0.23 5.83 <0.001
เพศชาย) -0.56 0.25 2.24 0.03
ข้อสอบภาคปฏิบัติ 1.13 0.43 2.63 0.01

วิธีการตีความเพศ (ตัวแปรทำนายไบนารี)

เราจะเห็นได้ว่าการประมาณค่าสัมประสิทธิ์ เพศ เป็นลบ แสดงว่าการเป็นชายจะลดโอกาสสอบผ่าน

นอกจากนี้เรายังเห็นว่าค่า p ของเพศน้อยกว่า 0.05 ซึ่งหมายความว่ามีค่า P-Value อย่างมีนัยสำคัญทางสถิติว่าบุคคลจะผ่านการสอบหรือไม่

เพื่อให้เข้าใจได้อย่างแน่ชัดว่าการเป็นผู้ชายส่งผลต่อการผ่านการสอบหรือไม่ เราสามารถใช้สูตร e β ได้

อี -0.56 = 0.57

เราตีความสิ่งนี้ว่าหมายความว่าผู้ชายมีโอกาสสอบผ่านมากกว่าผู้หญิงเพียง 0.57 เท่า โดยถือว่าจำนวนข้อสอบฝึกหัดคงที่

นอกจากนี้เรายังอาจกล่าวได้ว่าผู้ชายมี โอกาสสอบผ่านน้อยกว่าผู้หญิง (1 – 0.57) 43% และสมมติว่าจำนวนข้อสอบฝึกหัดคงที่

วิธีตีความข้อสอบภาคปฏิบัติ (ตัวแปรทำนายต่อเนื่อง)

เราจะเห็นว่าการประมาณค่าสัมประสิทธิ์สำหรับ การสอบภาคปฏิบัติ เป็นค่าบวก ซึ่งบ่งชี้ว่าการสอบภาคปฏิบัติเพิ่มเติมแต่ละครั้งจะเพิ่มโอกาสในการสอบปลายภาค

เรายังเห็นได้ว่าค่า p สำหรับจำนวนข้อสอบฝึกหัดที่ทำน้อยกว่า 0.05 ซึ่งหมายความว่ามีค่า p-value อย่างมีนัยสำคัญทางสถิติว่าแต่ละคนจะผ่านการสอบปลายภาคหรือไม่

ในการหาปริมาณผลกระทบของการสอบภาคปฏิบัติเพิ่มเติมแต่ละครั้งต่อว่าแต่ละคนจะผ่านการสอบปลายภาคหรือไม่ เราสามารถใช้สูตร e β

อี 1.13 = 3.09

เราตีความสิ่งนี้ว่าหมายความว่าการสอบภาคปฏิบัติเพิ่มเติมแต่ละครั้งจะเพิ่มโอกาสในการผ่านการสอบปลายภาค 3.09 โดยสมมติว่าเพศคงที่

นอกจากนี้เรายังอาจกล่าวได้ว่าแบบฝึกหัดฝึกหัดเพิ่มเติมแต่ละครั้งมีความเกี่ยวข้องกับ โอกาสที่จะผ่านการสอบปลายภาคเพิ่มขึ้น (3.09 – 1) 209% และ สมมติว่าเพศยังคงที่

หมายเหตุ : โปรดดู บทความนี้ เพื่อเรียนรู้วิธีตีความคำศัพท์ดั้งเดิมในแบบจำลองการถดถอยโลจิสติก

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับการถดถอยโลจิสติก:

วิธีรายงานผลการถดถอยโลจิสติก
ทำความเข้าใจสมมติฐานว่างสำหรับการถดถอยโลจิสติก
ความแตกต่างระหว่างการถดถอยโลจิสติกและการถดถอยเชิงเส้น

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *