คู่มือฉบับสมบูรณ์: วิธีรายงานผลลัพธ์การถดถอยลอจิสติก
การถดถอยแบบลอจิสติก คือประเภทของการวิเคราะห์การถดถอยที่เราใช้เมื่อ ตัวแปรตอบสนอง เป็นไบนารี
เราสามารถใช้รูปแบบทั่วไปต่อไปนี้เพื่อรายงานผลลัพธ์ของแบบจำลองการถดถอยโลจิสติก:
การถดถอยโลจิสติกใช้ในการวิเคราะห์ความสัมพันธ์ระหว่าง [ตัวแปรทำนาย 1], [ตัวแปรทำนาย 2],…[ตัวแปรทำนาย n ] และ [ตัวแปรตอบสนอง]
พบว่า เมื่อคงตัวแปรทำนายอื่นๆ ทั้งหมดไว้คงที่ ความน่าจะเป็นที่ [ตัวแปรการตอบสนอง] จะเกิดขึ้น [เพิ่มขึ้นหรือลดลง] ขึ้น [ไม่กี่เปอร์เซ็นต์] (95% CI [ขีดจำกัดล่าง ขีดจำกัดบน]) สำหรับการเพิ่มหนึ่งหน่วยใน [ตัวแปรทำนาย 1]
พบว่า เมื่อคงตัวแปรทำนายอื่นๆ ทั้งหมดไว้คงที่ ความน่าจะเป็นที่ [ตัวแปรการตอบสนอง] จะเกิดขึ้น [เพิ่มขึ้นหรือลดลง] ขึ้น [ไม่กี่เปอร์เซ็นต์] (95% CI [ขีดจำกัดล่าง ขีดจำกัดบน]) สำหรับการเพิ่มหนึ่งหน่วยใน [ตัวแปรทำนาย 2]
…
เราสามารถใช้ไวยากรณ์พื้นฐานนี้เพื่อรายงานอัตราส่วนอัตราต่อรองและช่วงความเชื่อมั่น 95% ที่สอดคล้องกันสำหรับอัตราส่วนอัตราต่อรองของตัวแปรทำนายแต่ละตัวในแบบจำลอง
ตัวอย่างต่อไปนี้แสดงวิธีการรายงานผลลัพธ์ของแบบจำลองการถดถอยโลจิสติกในทางปฏิบัติ
ตัวอย่าง: การรายงานผลลัพธ์การถดถอยโลจิสติก
สมมติว่าศาสตราจารย์ต้องการเข้าใจว่าโปรแกรมการศึกษาสองโปรแกรมที่แตกต่างกัน (โปรแกรม A และโปรแกรม B) และจำนวนชั่วโมงที่เรียนส่งผลต่อความน่าจะเป็นที่นักเรียนจะผ่านการสอบปลายภาคของชั้นเรียนหรือไม่
เหมาะกับแบบจำลองการถดถอยลอจิสติกส์โดยใช้ชั่วโมงการศึกษาและโปรแกรมการศึกษาเป็นตัวแปรทำนายและผลการสอบ (ผ่านหรือไม่ผ่าน) เป็นตัวแปรตอบสนอง
ผลลัพธ์ต่อไปนี้แสดงผลลัพธ์ของแบบจำลองการถดถอยโลจิสติก:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.415 0.623 -3.876 <0.000
program_A 0.344 0.156 2.205 0.027
hours 0.006 0.002 3.000 0.003
ก่อนที่จะรายงานผลลัพธ์ของแบบจำลองการถดถอยโลจิสติก เราต้องคำนวณอัตราส่วนอัตราต่อรองสำหรับตัวแปรทำนายแต่ละตัวก่อนโดยใช้สูตร e β
ตัวอย่างเช่น ต่อไปนี้คือวิธีคำนวณอัตราส่วนอัตราต่อรองสำหรับตัวแปรทำนายแต่ละตัว:
- อัตราส่วนอัตราต่อรองของโปรแกรม: e 0.344 = 1.41
- อัตราต่อรองของชั่วโมง: e 0.006 = 1.006
นอกจากนี้เรายังต้องคำนวณช่วงความเชื่อมั่น 95% สำหรับอัตราส่วนอัตราต่อรองของตัวแปรทำนายแต่ละตัวโดยใช้สูตร e (β +/- 1.96*ข้อผิดพลาดมาตรฐาน)
ตัวอย่างเช่น ต่อไปนี้คือวิธีคำนวณอัตราส่วนอัตราต่อรองสำหรับตัวแปรทำนายแต่ละตัว:
- CI 95% สำหรับอัตราส่วนอัตราต่อรองของโปรแกรม: e 0.344 +/- 1.96*0.156 = [1.04, 1.92]
- CI 95% สำหรับอัตราต่อรองของชั่วโมง: e 0.006 +/- 1.96*0.002 = [1.002, 1.009]
ตอนนี้เราได้คำนวณอัตราส่วนอัตราต่อรองและช่วงความเชื่อมั่นที่สอดคล้องกันสำหรับตัวแปรทำนายแต่ละตัวแล้ว เราสามารถรายงานผลลัพธ์ของแบบจำลองได้ดังต่อไปนี้:
ใช้การถดถอยโลจิสติกเพื่อวิเคราะห์ความสัมพันธ์ระหว่างหลักสูตรกับชั่วโมงเรียนเกี่ยวกับความน่าจะเป็นที่จะสอบปลายภาค
พบว่าเมื่อรักษาจำนวนชั่วโมงเรียนให้คงที่ โอกาสในการสอบปลายภาคเพิ่มขึ้น 41% (95% CI [0.04, 0.92]) สำหรับนักศึกษาที่เรียนโปรแกรม A กับโปรแกรม B
นอกจากนี้ยังพบว่า หากรักษาโปรแกรมการศึกษาไว้คงที่ โอกาสในการผ่านการสอบปลายภาคเพิ่มขึ้น 0.6% (95% CI [0.002, 0.009]) สำหรับแต่ละชั่วโมงที่เรียนเพิ่มเติม
โปรดทราบว่าเราได้รายงานอัตราส่วนอัตราต่อรองสำหรับตัวแปรทำนายซึ่งตรงข้ามกับค่าเบต้าของโมเดล เนื่องจากอัตราส่วนอัตราต่อรองนั้นง่ายต่อการตีความและทำความเข้าใจ
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับการถดถอยโลจิสติก:
รู้เบื้องต้นเกี่ยวกับการถดถอยโลจิสติก
วิธีดำเนินการถดถอยโลจิสติกใน R
วิธีการดำเนินการถดถอยโลจิสติกใน Python
4 ตัวอย่างการใช้ Logistic Regression ในชีวิตจริง