วิธีการตีความผลลัพธ์การถดถอยใน excel
การถดถอยเชิงเส้นพหุคูณเป็นหนึ่งในเทคนิคที่ใช้บ่อยที่สุดในสถิติทั้งหมด
บทช่วยสอนนี้จะอธิบายวิธีการตีความแต่ละค่าในผลลัพธ์ของแบบจำลองการถดถอยเชิงเส้นหลายตัวใน Excel
ตัวอย่าง: การตีความผลลัพธ์การถดถอยใน Excel
สมมติว่าเราต้องการทราบว่าจำนวนชั่วโมงที่ใช้ในการศึกษาและจำนวนการสอบเตรียมสอบส่งผลต่อเกรดที่นักเรียนได้รับในการสอบเข้าวิทยาลัยบางประเภทหรือไม่
ในการสำรวจความสัมพันธ์นี้ เราสามารถทำการถดถอยเชิงเส้นพหุคูณโดยใช้ ชั่วโมงการศึกษา และ การสอบเตรียมการที่ ใช้เป็นตัวแปรทำนายและ คะแนนการสอบ เป็นตัวแปรตอบสนอง
ภาพหน้าจอต่อไปนี้แสดงผลลัพธ์การถดถอยของแบบจำลองนี้ใน Excel:

ต่อไปนี้เป็นวิธีตีความค่าที่ใหญ่ที่สุดในเอาต์พุต:
หลายค่า R: 0.857 นี่แสดงถึงความสัมพันธ์พหุคูณระหว่างตัวแปรตอบสนองและตัวแปรทำนายทั้งสอง
อาร์ สแควร์: 0.734 . นี่เรียกว่าสัมประสิทธิ์การตัดสินใจ เป็นสัดส่วนของความแปรปรวนของตัวแปรตอบสนองที่สามารถอธิบายได้ด้วยตัวแปรอธิบาย ในตัวอย่างนี้ 73.4% ของการเปลี่ยนแปลงของคะแนนสอบอธิบายได้จากจำนวนชั่วโมงที่เรียนและจำนวนการสอบเพื่อเตรียมสอบ
ปรับ R สแควร์แล้ว: 0.703 ซึ่งแสดงถึงค่า R Square ที่ปรับตามจำนวนตัวแปรทำนายในโมเดล ค่านี้จะต่ำกว่าค่า R Square ด้วย และจะลงโทษโมเดลที่ใช้ตัวแปรทำนายมากเกินไปในโมเดล
ข้อผิดพลาดมาตรฐาน: 5.366 นี่คือระยะห่างเฉลี่ยระหว่างค่าที่สังเกตได้กับเส้นถดถอย ในตัวอย่างนี้ ค่าที่สังเกตได้เบี่ยงเบนไปจากเส้นถดถอยโดยเฉลี่ย 5,366 หน่วย
ความคิดเห็น: 20 . ขนาดตัวอย่างรวมของชุดข้อมูลที่ใช้สร้างแบบจำลองการถดถอย
F: 23:46 น. นี่คือสถิติ F โดยรวมสำหรับแบบจำลองการถดถอย ซึ่งคำนวณเป็น MS การถดถอย/MS ที่เหลือ
ความหมาย F: 0.0000 นี่คือค่า p ที่เกี่ยวข้องกับสถิติ F โดยรวม ข้อมูลนี้บอกเราว่าแบบจำลองการถดถอยโดยรวมมีนัยสำคัญทางสถิติหรือไม่
ในกรณีนี้ ค่า p น้อยกว่า 0.05 ซึ่งบ่งชี้ว่าตัวแปรอธิบาย ชั่วโมงการศึกษา และ การสอบเตรียมสอบ รวมกัน มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับ ผลการสอบ
ค่าสัมประสิทธิ์: ค่าสัมประสิทธิ์ของตัวแปรอธิบายแต่ละตัวบอกเราถึงการเปลี่ยนแปลงโดยเฉลี่ยที่คาดหวังในตัวแปรตอบสนอง โดยสมมติว่าตัวแปรอธิบายอื่น ๆ ยังคงที่
ตัวอย่างเช่น ในแต่ละชั่วโมงที่เรียนเพิ่มเติม คาดว่าคะแนนสอบเฉลี่ยจะเพิ่มขึ้น 5.56 โดยสมมติว่า ข้อสอบฝึกหัดที่เรียน คงที่
เราตีความค่าสัมประสิทธิ์การสกัดกั้นว่าคะแนนสอบที่คาดหวังสำหรับนักเรียนที่ไม่ได้เรียนหลายชั่วโมงและไม่สอบเพื่อเตรียมการคือ 67.67
ค่า P ค่า p ส่วนบุคคลบอกเราว่าตัวแปรอธิบายแต่ละตัวมีนัยสำคัญทางสถิติหรือไม่ เราจะเห็นว่า จำนวนชั่วโมงที่เรียน มีนัยสำคัญทางสถิติ (p = 0.00) ในขณะที่ การสอบเพื่อเตรียมการ (p = 0.52) ไม่มีนัยสำคัญทางสถิติที่ α = 0.05
วิธีเขียนสมการถดถอยโดยประมาณ
เราสามารถใช้สัมประสิทธิ์จากเอาต์พุตแบบจำลองเพื่อสร้างสมการการถดถอยโดยประมาณต่อไปนี้:
คะแนนสอบ = 67.67 + 5.56*(ชม.) – 0.60*(สอบเตรียมอุดมศึกษา)
เราสามารถใช้สมการการถดถอยโดยประมาณนี้เพื่อคำนวณคะแนนสอบที่คาดหวังสำหรับนักเรียน โดยพิจารณาจากจำนวนชั่วโมงเรียนและจำนวนข้อสอบฝึกหัดที่พวกเขาทำ
เช่น นักเรียนที่เรียน 3 ชั่วโมงและสอบเตรียมสอบควรได้เกรด 83.75 :
คะแนนสอบ = 67.67 + 5.56*(3) – 0.60*(1) = 83.75
โปรดทราบว่าเนื่องจาก การสอบเตรียมการที่ผ่านมา ไม่มีนัยสำคัญทางสถิติ (p=0.52) เราอาจตัดสินใจลบออกเนื่องจากไม่ได้ให้การปรับปรุงใดๆ กับโมเดลโดยรวม
ในกรณีนี้ เราสามารถทำการถดถอยเชิงเส้นอย่างง่ายโดยใช้เพียง ชั่วโมงที่ศึกษา เป็นตัวแปรอธิบาย
แหล่งข้อมูลเพิ่มเติม
รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นอย่างง่าย
รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นพหุคูณ