วิธีการตีความค่าสัมประสิทธิ์การถดถอย


ในสถิติ การวิเคราะห์การถดถอย เป็นเทคนิคที่สามารถใช้เพื่อวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรทำนายและตัวแปรตอบสนอง

เมื่อคุณใช้ซอฟต์แวร์ (เช่น R , Stata , SPSS ฯลฯ ) เพื่อทำการวิเคราะห์การถดถอย คุณจะได้รับตารางการถดถอยที่สรุปผลการถดถอยเป็นเอาต์พุต

ตัวเลขที่สำคัญที่สุดในผลลัพธ์ของตารางการถดถอยอาจเป็น ค่าสัมประสิทธิ์การถดถอย แม้จะมีความสำคัญ แต่หลายคนก็ยังพยายามตีความตัวเลขเหล่านี้ให้ถูกต้อง

บทช่วยสอนนี้นำเสนอตัวอย่างการวิเคราะห์การถดถอยและให้คำอธิบายโดยละเอียดเกี่ยวกับวิธีการตีความค่าสัมประสิทธิ์การถดถอยที่เป็นผลมาจากการถดถอย

ที่เกี่ยวข้อง: วิธีอ่านและตีความตารางการถดถอยทั้งหมด

ตัวอย่างการวิเคราะห์การถดถอย

สมมติว่าเราต้องการทำการ วิเคราะห์การถดถอยโดยใช้ตัวแปรต่อไปนี้:

ตัวแปรทำนาย

  • จำนวนชั่วโมงที่ศึกษาทั้งหมด ( ตัวแปรต่อเนื่อง – ระหว่าง 0 ถึง 20 )
  • นักเรียนใช้ติวเตอร์หรือไม่ ( ตัวแปรหมวดหมู่ – “ใช่” หรือ “ไม่ใช่” )

ตัวแปรตอบสนอง

  • คะแนนสอบ ( ตัวแปร ต่อเนื่อง – ระหว่าง 1 ถึง 100 )

เราต้องการตรวจสอบความสัมพันธ์ระหว่างตัวแปรทำนายและตัวแปรตอบสนองเพื่อดูว่าชั่วโมงเรียนและนักเรียนที่ใช้ติวเตอร์มีผลกระทบสำคัญต่อคะแนนสอบหรือไม่

สมมติว่าเราทำการวิเคราะห์การถดถอยและได้ผลลัพธ์ดังต่อไปนี้:

ภาคเรียน ค่าสัมประสิทธิ์ มาตรฐานบกพร่อง สถิติ ค่า P
สกัดกั้น 48.56 14:32 น. 3.39 0.002
ชั่วโมงการศึกษา 2.03 0.67 3.03 0.009
ติวเตอร์ 8.34 5.68 1.47 0.138

เรามาดูวิธีการตีความค่าสัมประสิทธิ์การถดถอยแต่ละค่ากัน

การตีความการสกัดกั้น

คำ ดั้งเดิม ในตารางการถดถอยบอกเราถึงค่าเฉลี่ยที่คาดหวังสำหรับตัวแปรตอบสนอง เมื่อตัวแปรตัวทำนายทั้งหมดมีค่าเท่ากับศูนย์

ในตัวอย่างนี้ ค่าสัมประสิทธิ์การถดถอยสำหรับจุดกำเนิดจะเท่ากับ 48.56 ซึ่งหมายความว่าสำหรับนักเรียนที่เรียนเป็นศูนย์ชั่วโมง ( ชั่วโมงเรียน = 0) และไม่ได้ใช้ติวเตอร์ ( ติวเตอร์ = 0) คะแนนสอบเฉลี่ยที่คาดหวังคือ 48.56

สิ่งสำคัญคือต้องทราบว่าค่าสัมประสิทธิ์การถดถอยสำหรับจุดตัดแกนจะมีนัยสำคัญก็ต่อเมื่อมีเหตุผลสมควรที่ตัวแปรทำนายทั้งหมดในแบบจำลองจะเท่ากับศูนย์ได้จริง ในตัวอย่างนี้ เป็นไปได้อย่างแน่นอนว่านักเรียนเรียนเป็นศูนย์ชั่วโมง ( ชั่วโมงที่เรียน = 0) และไม่ได้ใช้ติวเตอร์ด้วย ( กวดวิชา = 0) ดังนั้นการตีความค่าสัมประสิทธิ์การถดถอยของจุดตัดจึงมีความหมายในตัวอย่างนี้

อย่างไรก็ตาม ในบางกรณี ค่าสัมประสิทธิ์การถดถอยสำหรับการสกัดกั้นไม่มีนัยสำคัญ ตัวอย่างเช่น สมมติว่าเราทำการวิเคราะห์การถดถอยโดยใช้ พื้นที่เป็นตารางฟุต เป็นตัวแปรทำนายและ ค่าโฮม เป็นตัวแปรตอบสนอง

ในตารางการถดถอยเอาท์พุท ค่าสัมประสิทธิ์การถดถอยสำหรับคำเดิมจะไม่มีการตีความที่มีความหมาย เนื่องจาก พื้นที่เป็นตารางฟุต ของบ้านไม่สามารถเท่ากับศูนย์ได้ ในกรณีนี้ ค่าสัมประสิทธิ์การถดถอยสำหรับคำดั้งเดิมจะยึดเส้นการถดถอยในตำแหน่งที่ถูกต้อง

การตีความค่าสัมประสิทธิ์ของตัวแปรทำนายต่อเนื่อง

สำหรับตัวแปรตัวทำนายแบบต่อเนื่อง ค่าสัมประสิทธิ์การถดถอยแสดงถึงความแตกต่างระหว่างค่าทำนายของตัวแปรตอบสนองสำหรับการเปลี่ยนแปลงแต่ละหน่วยในตัวแปรตัวทำนาย โดยถือว่าตัวแปรตัวทำนายอื่นๆ ทั้งหมดยังคงที่

ในตัวอย่างนี้ ชั่วโมงที่ศึกษา เป็นตัวแปรทำนายต่อเนื่องซึ่งมีช่วงตั้งแต่ 0 ถึง 20 ชั่วโมง ในบางกรณี นักเรียนเรียนเพียงศูนย์ชั่วโมง และในกรณีอื่นๆ นักเรียนเรียนสูงสุด 20 ชั่วโมง

จากผลการถดถอยเราจะเห็นว่าค่าสัมประสิทธิ์การถดถอยของ ชั่วโมงที่ศึกษา คือ 2.03 ซึ่งหมายความว่าโดยเฉลี่ยแล้ว แต่ละชั่วโมงที่ศึกษาเพิ่มเติมจะสัมพันธ์กับคะแนนสอบปลายภาคที่เพิ่มขึ้น 2.03 คะแนน โดยสมมติว่า ตัวแปรติวเตอร์ ตัวทำนายคงที่

ตัวอย่างเช่น ลองพิจารณานักเรียน A ที่เรียน 10 ชั่วโมงและใช้ติวเตอร์ ลองพิจารณานักเรียน B ที่เรียน 11 ชั่วโมงและใช้ติวเตอร์ด้วย จากผลการถดถอยของเรา คาดว่านักเรียน B จะทำคะแนนสอบได้สูงกว่านักเรียน A 2.03 คะแนน

ค่า p ของตารางการถดถอยบอกเราว่าสัมประสิทธิ์การถดถอยนี้มีนัยสำคัญทางสถิติจริงหรือไม่ เราจะเห็นว่าค่า p ของ ชั่วโมงที่ศึกษา คือ 0.009 ซึ่งมีนัยสำคัญทางสถิติที่ระดับอัลฟา 0.05

หมายเหตุ: ต้องเลือกระดับอัลฟ่าก่อนทำการวิเคราะห์การถดถอย ตัวเลือกทั่วไปสำหรับระดับอัลฟ่าคือ 0.01, 0.05 และ 0.10

บทความที่เกี่ยวข้อง: คำอธิบายค่า P และนัยสำคัญทางสถิติ

การตีความค่าสัมประสิทธิ์ของตัวแปรทำนายเชิงหมวดหมู่

สำหรับตัวแปรทำนายเชิงหมวดหมู่ ค่าสัมประสิทธิ์การถดถอยแสดงถึงความแตกต่างในค่าที่ทำนายของตัวแปรตอบสนองระหว่างหมวดหมู่ที่ตัวแปรทำนาย = 0 และหมวดหมู่ที่ตัวแปรทำนาย = 1

ในตัวอย่างนี้ Tutor เป็นตัวแปรทำนายเชิงหมวดหมู่ที่สามารถรับค่าที่แตกต่างกันได้สองค่า:

  • 1 = นักเรียนใช้ติวเตอร์เพื่อเตรียมตัวสอบ
  • 0 = นักเรียนไม่ได้ใช้ติวเตอร์เตรียมตัวสอบ

จากผลการถดถอย เราจะเห็นว่าค่าสัมประสิทธิ์การถดถอยของ ติวเตอร์ คือ 8.34 ซึ่งหมายความว่า โดยเฉลี่ยแล้ว นักเรียนที่ใช้ติวเตอร์ทำคะแนนในการสอบได้สูงกว่านักเรียนที่ไม่ได้ใช้ติวเตอร์ 8.34 คะแนน โดยถือว่าตัวแปร ชั่วโมงเรียน คงที่

ตัวอย่างเช่น ลองพิจารณานักเรียน A ที่เรียน 10 ชั่วโมงและใช้ติวเตอร์ นอกจากนี้ ให้พิจารณานักเรียน B ที่เรียน 10 ชั่วโมงและไม่ได้ใช้ติวเตอร์ด้วย จากผลการถดถอยของเรา คาดว่านักเรียน A จะมีคะแนนสอบสูงกว่านักเรียน B 8.34 คะแนน

ค่า p ของตารางการถดถอยบอกเราว่าสัมประสิทธิ์การถดถอยนี้มีนัยสำคัญทางสถิติจริงหรือไม่ เราจะเห็นว่าค่า p ของ Tutor คือ 0.138 ซึ่งไม่มีนัยสำคัญทางสถิติที่ระดับอัลฟ่าที่ 0.05 สิ่งนี้บ่งชี้ว่าแม้ว่านักเรียนที่ใช้ติวเตอร์จะสอบได้ดีกว่า แต่ความแตกต่างนี้อาจเนื่องมาจากโอกาส

ตีความสัมประสิทธิ์ทั้งหมดพร้อมกัน

เราสามารถใช้สัมประสิทธิ์ทั้งหมดในตารางการถดถอยเพื่อสร้างสมการการถดถอยโดยประมาณต่อไปนี้:

คะแนนสอบที่คาดหวัง = 48.56 + 2.03*(ชั่วโมงเรียน) + 8.34*(ติวเตอร์)

หมายเหตุ : โปรดทราบว่าตัวแปรตัวทำนาย “ติวเตอร์” ไม่มีนัยสำคัญทางสถิติที่ระดับอัลฟ่า 0.05 ดังนั้นคุณอาจเลือกที่จะลบตัวทำนายนี้ออกจากแบบจำลองและไม่ใช้มันในการประมาณค่าขั้นสุดท้ายของสมการถดถอย

เมื่อใช้สมการการถดถอยโดยประมาณนี้ เราสามารถทำนายคะแนนสอบปลายภาคของนักเรียนโดยพิจารณาจากจำนวนชั่วโมงเรียนทั้งหมด และพวกเขาใช้ครูสอนพิเศษหรือไม่

ตัวอย่างเช่น นักเรียนที่เรียน 10 ชั่วโมงและใช้ติวเตอร์ควรได้รับคะแนนสอบ:

คะแนนสอบที่คาดหวัง = 48.56 + 2.03*(10) + 8.34*(1) = 77.2

คำนึงถึงความสัมพันธ์เมื่อตีความค่าสัมประสิทธิ์การถดถอย

สิ่งสำคัญคือต้องจำไว้ว่าตัวแปรทำนายสามารถมีอิทธิพลซึ่งกันและกันในแบบจำลองการถดถอย ตัวอย่างเช่น ตัวแปรทำนายส่วนใหญ่จะมีความเกี่ยวข้องกันเป็นอย่างน้อย (เช่น นักเรียนที่เรียนมากกว่ามักจะใช้ติวเตอร์มากกว่า)

ซึ่งหมายความว่าค่าสัมประสิทธิ์การถดถอยจะเปลี่ยนไปเมื่อมีการเพิ่มหรือลบตัวแปรทำนายที่แตกต่างกันออกจากแบบจำลอง

วิธีที่ดีในการดูว่าความสัมพันธ์ระหว่างตัวแปรทำนายนั้นรุนแรงพอที่จะส่งผลต่อแบบจำลองการถดถอยอย่างจริงจังหรือไม่ คือการ ตรวจสอบ VIF ระหว่างตัวแปรทำนาย

วิธีนี้จะบอกคุณว่าความสัมพันธ์ระหว่างตัวแปรทำนายเป็นปัญหาที่ต้องแก้ไขก่อนตัดสินใจตีความค่าสัมประสิทธิ์การถดถอยหรือไม่

หากคุณรัน โมเดลการถดถอยเชิงเส้นอย่างง่าย ด้วยตัวทำนายตัวเดียว ตัวแปรตัวทำนายที่สัมพันธ์กันจะไม่เป็นปัญหา

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *