ทำความเข้าใจกับข้อผิดพลาดมาตรฐานของความชันการถดถอย


ข้อผิดพลาดมาตรฐานของความชันของการถดถอย เป็นวิธีหนึ่งในการวัด “ความไม่แน่นอน” ในการประมาณค่าความชันของการถดถอย

มีการคำนวณดังนี้:

สูตรสำหรับความคลาดเคลื่อนมาตรฐานของความชันถดถอย

ทอง:

  • n : ขนาดตัวอย่างทั้งหมด
  • y i : ค่าที่แท้จริงของตัวแปรตอบสนอง
  • ŷ i : ค่าที่ทำนายของตัวแปรตอบสนอง
  • x i : ค่าที่แท้จริงของตัวแปรทำนาย
  • : ค่าเฉลี่ยของตัวแปรทำนาย

ยิ่งข้อผิดพลาดมาตรฐานมีค่าน้อยลง ความแปรปรวนรอบค่าสัมประสิทธิ์การประมาณค่าความชันของการถดถอยก็จะยิ่งน้อยลง

ข้อผิดพลาดมาตรฐานของความชันการถดถอยจะแสดงในคอลัมน์ “ข้อผิดพลาดมาตรฐาน” ในเอาต์พุตการถดถอยของซอฟต์แวร์ทางสถิติส่วนใหญ่:

ตัวอย่างต่อไปนี้แสดงวิธีตีความข้อผิดพลาดมาตรฐานของความชันการถดถอยในสองสถานการณ์ที่แตกต่างกัน

ตัวอย่างที่ 1: การตีความข้อผิดพลาดมาตรฐานเล็กน้อยของความชันการถดถอย

สมมติว่าอาจารย์ต้องการเข้าใจความสัมพันธ์ระหว่างจำนวนชั่วโมงเรียนกับคะแนนสอบปลายภาคของนักเรียนในชั้นเรียน

รวบรวมข้อมูลสำหรับนักเรียน 25 คนและสร้างแผนภาพกระจายต่อไปนี้:

มีความสัมพันธ์เชิงบวกอย่างชัดเจนระหว่างตัวแปรทั้งสอง เมื่อจำนวนชั่วโมงที่เรียนเพิ่มขึ้น คะแนนการสอบก็จะเพิ่มขึ้นในอัตราที่สามารถคาดเดาได้พอสมควร

จากนั้นเขาก็ใส่แบบจำลองการถดถอยเชิงเส้นอย่างง่ายโดยใช้ชั่วโมงที่ศึกษาเป็นตัวแปรทำนายและเกรดการสอบปลายภาคเป็นตัวแปรตอบสนอง

ตารางต่อไปนี้แสดงผลการถดถอย:

ค่าสัมประสิทธิ์ของตัวแปรทำนาย “ชั่วโมงการศึกษา” คือ 5.487 สิ่งนี้บอกเราว่าแต่ละชั่วโมงที่เรียนเพิ่มเติมนั้นสัมพันธ์กับคะแนนสอบที่เพิ่มขึ้นโดยเฉลี่ย 5,487

ข้อผิดพลาดมาตรฐานคือ 0.419 ซึ่งแสดงถึงการวัดความแปรปรวนรอบค่าประมาณนี้สำหรับความชันของการถดถอย

เราสามารถใช้ค่านี้เพื่อคำนวณสถิติ t สำหรับตัวแปรทำนาย “ชั่วโมงที่ศึกษา”:

  • t สถิติ = การประมาณค่าสัมประสิทธิ์ / ความคลาดเคลื่อนมาตรฐาน
  • สถิติ t = 5.487 / 0.419
  • สถิติ t = 13.112

ค่า p ที่สอดคล้องกับสถิติการทดสอบนี้คือ 0.000 ซึ่งบ่งชี้ว่า “ชั่วโมงที่เรียน” มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับคะแนนสอบปลายภาค

เนื่องจากข้อผิดพลาดมาตรฐานของความชันการถดถอยมีขนาดเล็กเมื่อเทียบกับการประมาณค่าสัมประสิทธิ์ของความชันการถดถอย ตัวแปรตัวทำนายจึงมีนัยสำคัญทางสถิติ

ตัวอย่างที่ 2: การตีความข้อผิดพลาดมาตรฐานขนาดใหญ่ของความชันการถดถอย

สมมติว่าศาสตราจารย์อีกคนต้องการเข้าใจความสัมพันธ์ระหว่างจำนวนชั่วโมงเรียนกับคะแนนสอบปลายภาคของนักเรียนในชั้นเรียนของเขา

เธอรวบรวมข้อมูลสำหรับนักเรียน 25 คน และสร้างแผนภาพกระจายต่อไปนี้:

ดูเหมือนจะมีความสัมพันธ์เชิงบวกเล็กน้อยระหว่างตัวแปรทั้งสอง เมื่อจำนวนชั่วโมงเรียนเพิ่มขึ้น โดยทั่วไปคะแนนสอบจะเพิ่มขึ้น แต่ไม่ใช่ในอัตราที่คาดเดาได้

สมมติว่าศาสตราจารย์เหมาะกับแบบจำลองการถดถอยเชิงเส้นอย่างง่ายโดยใช้ชั่วโมงที่ศึกษาเป็นตัวแปรทำนายและเกรดการสอบปลายภาคเป็นตัวแปรตอบสนอง

ตารางต่อไปนี้แสดงผลการถดถอย:

ค่าสัมประสิทธิ์ของตัวแปรทำนาย “ชั่วโมงการศึกษา” คือ 1.7919 สิ่งนี้บอกเราว่าแต่ละชั่วโมงที่เรียนเพิ่มเติมนั้นสัมพันธ์กับคะแนนสอบที่เพิ่มขึ้นโดยเฉลี่ย 1.7919

ข้อผิดพลาดมาตรฐานคือ 1.0675 ซึ่งเป็นการวัดความแปรปรวนรอบค่าประมาณนี้สำหรับความชันของการถดถอย

เราสามารถใช้ค่านี้เพื่อคำนวณสถิติ t สำหรับตัวแปรทำนาย “ชั่วโมงที่ศึกษา”:

  • t สถิติ = การประมาณค่าสัมประสิทธิ์ / ความคลาดเคลื่อนมาตรฐาน
  • สถิติ t = 1.7919 / 1.0675
  • สถิติ t = 1.678

ค่า p ที่สอดคล้องกับสถิติการทดสอบนี้คือ 0.107 เนื่องจากค่า p นี้ไม่น้อยกว่า 0.05 แสดงว่า “ชั่วโมงที่เรียน” ไม่มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับคะแนนสอบปลายภาค

เนื่องจากข้อผิดพลาดมาตรฐานของความชันการถดถอยมีมากเมื่อเทียบกับการประมาณค่าสัมประสิทธิ์ของความชันการถดถอย ตัวแปรทำนาย จึงไม่มี นัยสำคัญทางสถิติ

แหล่งข้อมูลเพิ่มเติม

รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นอย่างง่าย
รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นพหุคูณ
วิธีอ่านและตีความตารางการถดถอย

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *