คู่มือฉบับสมบูรณ์: วิธีรายงานผลลัพธ์การถดถอยลอจิสติก


การถดถอยแบบลอจิสติก คือประเภทของการวิเคราะห์การถดถอยที่เราใช้เมื่อ ตัวแปรตอบสนอง เป็นไบนารี

เราสามารถใช้รูปแบบทั่วไปต่อไปนี้เพื่อรายงานผลลัพธ์ของแบบจำลองการถดถอยโลจิสติก:

การถดถอยโลจิสติกใช้ในการวิเคราะห์ความสัมพันธ์ระหว่าง [ตัวแปรทำนาย 1], [ตัวแปรทำนาย 2],…[ตัวแปรทำนาย n ] และ [ตัวแปรตอบสนอง]

พบว่า เมื่อคงตัวแปรทำนายอื่นๆ ทั้งหมดไว้คงที่ ความน่าจะเป็นที่ [ตัวแปรการตอบสนอง] จะเกิดขึ้น [เพิ่มขึ้นหรือลดลง] ขึ้น [ไม่กี่เปอร์เซ็นต์] (95% CI [ขีดจำกัดล่าง ขีดจำกัดบน]) สำหรับการเพิ่มหนึ่งหน่วยใน [ตัวแปรทำนาย 1]

พบว่า เมื่อคงตัวแปรทำนายอื่นๆ ทั้งหมดไว้คงที่ ความน่าจะเป็นที่ [ตัวแปรการตอบสนอง] จะเกิดขึ้น [เพิ่มขึ้นหรือลดลง] ขึ้น [ไม่กี่เปอร์เซ็นต์] (95% CI [ขีดจำกัดล่าง ขีดจำกัดบน]) สำหรับการเพิ่มหนึ่งหน่วยใน [ตัวแปรทำนาย 2]

เราสามารถใช้ไวยากรณ์พื้นฐานนี้เพื่อรายงานอัตราส่วนอัตราต่อรองและช่วงความเชื่อมั่น 95% ที่สอดคล้องกันสำหรับอัตราส่วนอัตราต่อรองของตัวแปรทำนายแต่ละตัวในแบบจำลอง

ตัวอย่างต่อไปนี้แสดงวิธีการรายงานผลลัพธ์ของแบบจำลองการถดถอยโลจิสติกในทางปฏิบัติ

ตัวอย่าง: การรายงานผลลัพธ์การถดถอยโลจิสติก

สมมติว่าศาสตราจารย์ต้องการเข้าใจว่าโปรแกรมการศึกษาสองโปรแกรมที่แตกต่างกัน (โปรแกรม A และโปรแกรม B) และจำนวนชั่วโมงที่เรียนส่งผลต่อความน่าจะเป็นที่นักเรียนจะผ่านการสอบปลายภาคของชั้นเรียนหรือไม่

เหมาะกับแบบจำลองการถดถอยลอจิสติกส์โดยใช้ชั่วโมงการศึกษาและโปรแกรมการศึกษาเป็นตัวแปรทำนายและผลการสอบ (ผ่านหรือไม่ผ่าน) เป็นตัวแปรตอบสนอง

ผลลัพธ์ต่อไปนี้แสดงผลลัพธ์ของแบบจำลองการถดถอยโลจิสติก:

 Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept) -2.415 0.623 -3.876 <0.000
program_A 0.344 0.156 2.205 0.027
hours 0.006 0.002 3.000 0.003

ก่อนที่จะรายงานผลลัพธ์ของแบบจำลองการถดถอยโลจิสติก เราต้องคำนวณอัตราส่วนอัตราต่อรองสำหรับตัวแปรทำนายแต่ละตัวก่อนโดยใช้สูตร e β

ตัวอย่างเช่น ต่อไปนี้คือวิธีคำนวณอัตราส่วนอัตราต่อรองสำหรับตัวแปรทำนายแต่ละตัว:

  • อัตราส่วนอัตราต่อรองของโปรแกรม: e 0.344 = 1.41
  • อัตราต่อรองของชั่วโมง: e 0.006 = 1.006

นอกจากนี้เรายังต้องคำนวณช่วงความเชื่อมั่น 95% สำหรับอัตราส่วนอัตราต่อรองของตัวแปรทำนายแต่ละตัวโดยใช้สูตร e (β +/- 1.96*ข้อผิดพลาดมาตรฐาน)

ตัวอย่างเช่น ต่อไปนี้คือวิธีคำนวณอัตราส่วนอัตราต่อรองสำหรับตัวแปรทำนายแต่ละตัว:

  • CI 95% สำหรับอัตราส่วนอัตราต่อรองของโปรแกรม: e 0.344 +/- 1.96*0.156 = [1.04, 1.92]
  • CI 95% สำหรับอัตราต่อรองของชั่วโมง: e 0.006 +/- 1.96*0.002 = [1.002, 1.009]

ตอนนี้เราได้คำนวณอัตราส่วนอัตราต่อรองและช่วงความเชื่อมั่นที่สอดคล้องกันสำหรับตัวแปรทำนายแต่ละตัวแล้ว เราสามารถรายงานผลลัพธ์ของแบบจำลองได้ดังต่อไปนี้:

ใช้การถดถอยโลจิสติกเพื่อวิเคราะห์ความสัมพันธ์ระหว่างหลักสูตรกับชั่วโมงเรียนเกี่ยวกับความน่าจะเป็นที่จะสอบปลายภาค

พบว่าเมื่อรักษาจำนวนชั่วโมงเรียนให้คงที่ โอกาสในการสอบปลายภาคเพิ่มขึ้น 41% (95% CI [0.04, 0.92]) สำหรับนักศึกษาที่เรียนโปรแกรม A กับโปรแกรม B

นอกจากนี้ยังพบว่า หากรักษาโปรแกรมการศึกษาไว้คงที่ โอกาสในการผ่านการสอบปลายภาคเพิ่มขึ้น 0.6% (95% CI [0.002, 0.009]) สำหรับแต่ละชั่วโมงที่เรียนเพิ่มเติม

โปรดทราบว่าเราได้รายงานอัตราส่วนอัตราต่อรองสำหรับตัวแปรทำนายซึ่งตรงข้ามกับค่าเบต้าของโมเดล เนื่องจากอัตราส่วนอัตราต่อรองนั้นง่ายต่อการตีความและทำความเข้าใจ

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับการถดถอยโลจิสติก:

รู้เบื้องต้นเกี่ยวกับการถดถอยโลจิสติก
วิธีดำเนินการถดถอยโลจิสติกใน R
วิธีการดำเนินการถดถอยโลจิสติกใน Python
4 ตัวอย่างการใช้ Logistic Regression ในชีวิตจริง

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *