วิธีการตีความผลลัพธ์การถดถอยใน excel


การถดถอยเชิงเส้นพหุคูณเป็นหนึ่งในเทคนิคที่ใช้บ่อยที่สุดในสถิติทั้งหมด

บทช่วยสอนนี้จะอธิบายวิธีการตีความแต่ละค่าในผลลัพธ์ของแบบจำลองการถดถอยเชิงเส้นหลายตัวใน Excel

ตัวอย่าง: การตีความผลลัพธ์การถดถอยใน Excel

สมมติว่าเราต้องการทราบว่าจำนวนชั่วโมงที่ใช้ในการศึกษาและจำนวนการสอบเตรียมสอบส่งผลต่อเกรดที่นักเรียนได้รับในการสอบเข้าวิทยาลัยบางประเภทหรือไม่

ในการสำรวจความสัมพันธ์นี้ เราสามารถทำการถดถอยเชิงเส้นพหุคูณโดยใช้ ชั่วโมงการศึกษา และ การสอบเตรียมการที่ ใช้เป็นตัวแปรทำนายและ คะแนนการสอบ เป็นตัวแปรตอบสนอง

ภาพหน้าจอต่อไปนี้แสดงผลลัพธ์การถดถอยของแบบจำลองนี้ใน Excel:

เอาต์พุตการถดถอยเชิงเส้นหลายรายการใน Excel

ต่อไปนี้เป็นวิธีตีความค่าที่ใหญ่ที่สุดในเอาต์พุต:

หลายค่า R: 0.857 นี่แสดงถึงความสัมพันธ์พหุคูณระหว่างตัวแปรตอบสนองและตัวแปรทำนายทั้งสอง

อาร์ สแควร์: 0.734 . นี่เรียกว่าสัมประสิทธิ์การตัดสินใจ เป็นสัดส่วนของความแปรปรวนของตัวแปรตอบสนองที่สามารถอธิบายได้ด้วยตัวแปรอธิบาย ในตัวอย่างนี้ 73.4% ของการเปลี่ยนแปลงของคะแนนสอบอธิบายได้จากจำนวนชั่วโมงที่เรียนและจำนวนการสอบเพื่อเตรียมสอบ

ปรับ R สแควร์แล้ว: 0.703 ซึ่งแสดงถึงค่า R Square ที่ปรับตามจำนวนตัวแปรทำนายในโมเดล ค่านี้จะต่ำกว่าค่า R Square ด้วย และจะลงโทษโมเดลที่ใช้ตัวแปรทำนายมากเกินไปในโมเดล

ข้อผิดพลาดมาตรฐาน: 5.366 นี่คือระยะห่างเฉลี่ยระหว่างค่าที่สังเกตได้กับเส้นถดถอย ในตัวอย่างนี้ ค่าที่สังเกตได้เบี่ยงเบนไปจากเส้นถดถอยโดยเฉลี่ย 5,366 หน่วย

ความคิดเห็น: 20 . ขนาดตัวอย่างรวมของชุดข้อมูลที่ใช้สร้างแบบจำลองการถดถอย

F: 23:46 น. นี่คือสถิติ F โดยรวมสำหรับแบบจำลองการถดถอย ซึ่งคำนวณเป็น MS การถดถอย/MS ที่เหลือ

ความหมาย F: 0.0000 นี่คือค่า p ที่เกี่ยวข้องกับสถิติ F โดยรวม ข้อมูลนี้บอกเราว่าแบบจำลองการถดถอยโดยรวมมีนัยสำคัญทางสถิติหรือไม่

ในกรณีนี้ ค่า p น้อยกว่า 0.05 ซึ่งบ่งชี้ว่าตัวแปรอธิบาย ชั่วโมงการศึกษา และ การสอบเตรียมสอบ รวมกัน มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับ ผลการสอบ

ค่าสัมประสิทธิ์: ค่าสัมประสิทธิ์ของตัวแปรอธิบายแต่ละตัวบอกเราถึงการเปลี่ยนแปลงโดยเฉลี่ยที่คาดหวังในตัวแปรตอบสนอง โดยสมมติว่าตัวแปรอธิบายอื่น ๆ ยังคงที่

ตัวอย่างเช่น ในแต่ละชั่วโมงที่เรียนเพิ่มเติม คาดว่าคะแนนสอบเฉลี่ยจะเพิ่มขึ้น 5.56 โดยสมมติว่า ข้อสอบฝึกหัดที่เรียน คงที่

เราตีความค่าสัมประสิทธิ์การสกัดกั้นว่าคะแนนสอบที่คาดหวังสำหรับนักเรียนที่ไม่ได้เรียนหลายชั่วโมงและไม่สอบเพื่อเตรียมการคือ 67.67

ค่า P ค่า p ส่วนบุคคลบอกเราว่าตัวแปรอธิบายแต่ละตัวมีนัยสำคัญทางสถิติหรือไม่ เราจะเห็นว่า จำนวนชั่วโมงที่เรียน มีนัยสำคัญทางสถิติ (p = 0.00) ในขณะที่ การสอบเพื่อเตรียมการ (p = 0.52) ไม่มีนัยสำคัญทางสถิติที่ α = 0.05

วิธีเขียนสมการถดถอยโดยประมาณ

เราสามารถใช้สัมประสิทธิ์จากเอาต์พุตแบบจำลองเพื่อสร้างสมการการถดถอยโดยประมาณต่อไปนี้:

คะแนนสอบ = 67.67 + 5.56*(ชม.) – 0.60*(สอบเตรียมอุดมศึกษา)

เราสามารถใช้สมการการถดถอยโดยประมาณนี้เพื่อคำนวณคะแนนสอบที่คาดหวังสำหรับนักเรียน โดยพิจารณาจากจำนวนชั่วโมงเรียนและจำนวนข้อสอบฝึกหัดที่พวกเขาทำ

เช่น นักเรียนที่เรียน 3 ชั่วโมงและสอบเตรียมสอบควรได้เกรด 83.75 :

คะแนนสอบ = 67.67 + 5.56*(3) – 0.60*(1) = 83.75

โปรดทราบว่าเนื่องจาก การสอบเตรียมการที่ผ่านมา ไม่มีนัยสำคัญทางสถิติ (p=0.52) เราอาจตัดสินใจลบออกเนื่องจากไม่ได้ให้การปรับปรุงใดๆ กับโมเดลโดยรวม

ในกรณีนี้ เราสามารถทำการถดถอยเชิงเส้นอย่างง่ายโดยใช้เพียง ชั่วโมงที่ศึกษา เป็นตัวแปรอธิบาย

แหล่งข้อมูลเพิ่มเติม

รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นอย่างง่าย
รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นพหุคูณ

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *