ทำความเข้าใจสมมติฐานว่างสำหรับการถดถอยเชิงเส้น
การถดถอยเชิงเส้นเป็นเทคนิคที่เราสามารถใช้เพื่อทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรทำนายตั้งแต่หนึ่งตัวขึ้นไปกับ ตัวแปรตอบสนอง
หากเรามีตัวแปรทำนายเพียงตัวเดียวและตัวแปรตอบสนองหนึ่งตัว เราสามารถใช้ การถดถอยเชิงเส้นอย่างง่าย ซึ่งใช้สูตรต่อไปนี้เพื่อประมาณความสัมพันธ์ระหว่างตัวแปร:
ŷ = β 0 + β 1 x
ทอง:
- ŷ: ค่าตอบกลับโดยประมาณ
- β 0 : ค่าเฉลี่ยของ y เมื่อ x เป็นศูนย์
- β 1 : การเปลี่ยนแปลงโดยเฉลี่ยใน y สัมพันธ์กับการเพิ่มขึ้นของ x หนึ่งหน่วย
- x: ค่าของตัวแปรทำนาย
การถดถอยเชิงเส้นอย่างง่ายใช้สมมติฐานว่างและทางเลือกต่อไปนี้:
- ชม 0 : β 1 = 0
- HA : β 1 ≠ 0
สมมติฐานว่างระบุว่าสัมประสิทธิ์ β 1 เท่ากับศูนย์ กล่าวอีกนัยหนึ่ง ไม่มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างตัวแปรทำนาย x และตัวแปรตอบสนอง y
สมมติฐานทางเลือกระบุว่า β 1 ไม่ เท่ากับศูนย์ กล่าวอีกนัยหนึ่ง มี ความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่าง x และ y
หากเรามีตัวแปรทำนายหลายตัวและตัวแปรตอบสนองหนึ่งตัว เราสามารถใช้ การถดถอยเชิงเส้นหลายตัว ซึ่งใช้สูตรต่อไปนี้เพื่อประมาณความสัมพันธ์ระหว่างตัวแปร:
ŷ = β 0 + β 1 x 1 + β 2 x 2 + … + β k x k
ทอง:
- ŷ: ค่าตอบกลับโดยประมาณ
- β 0 : ค่าเฉลี่ยของ y เมื่อตัวแปรทำนายทั้งหมดมีค่าเท่ากับศูนย์
- β i : การเปลี่ยนแปลงโดยเฉลี่ยใน y สัมพันธ์กับการเพิ่มขึ้นหนึ่งหน่วยใน x i
- x i : ค่าของตัวแปรทำนาย x i
การถดถอยเชิงเส้นพหุคูณใช้สมมติฐานว่างและทางเลือกต่อไปนี้:
- H 0 : β 1 = β 2 = … = β k = 0
- HA : β 1 = β 2 = … = β k ≠ 0
สมมติฐานว่างระบุว่าสัมประสิทธิ์ทั้งหมดในแบบจำลองมีค่าเท่ากับศูนย์ กล่าวอีกนัยหนึ่ง ไม่มีตัวแปรทำนายใดที่มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับตัวแปรตอบสนอง y
สมมติฐานทางเลือกระบุว่าไม่ใช่ว่าสัมประสิทธิ์ทั้งหมดจะเท่ากับศูนย์พร้อมกัน
ตัวอย่างต่อไปนี้แสดงวิธีตัดสินใจว่าจะปฏิเสธหรือไม่ปฏิเสธสมมติฐานว่างในการถดถอยเชิงเส้นอย่างง่ายและแบบจำลองการถดถอยเชิงเส้นหลายตัว
ตัวอย่างที่ 1: การถดถอยเชิงเส้นอย่างง่าย
สมมติว่าอาจารย์ต้องการใช้จำนวนชั่วโมงเรียนเพื่อทำนายคะแนนสอบที่นักเรียนในชั้นเรียนจะได้ โดยรวบรวมข้อมูลจากนักเรียน 20 คนและเหมาะกับโมเดลการถดถอยเชิงเส้นอย่างง่าย
ภาพหน้าจอต่อไปนี้แสดงผลลัพธ์ของแบบจำลองการถดถอย:

โมเดลการถดถอยเชิงเส้นแบบง่ายที่ติดตั้งคือ:
คะแนนสอบ = 67.1617 + 5.2503*(ชั่วโมงเรียน)
เพื่อตรวจสอบว่ามีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างชั่วโมงที่เรียนกับคะแนนสอบหรือไม่ เราจำเป็นต้องวิเคราะห์ ค่า F โดยรวม ของแบบจำลองและค่า p ที่สอดคล้องกัน:
- ค่า F โดยรวม: 47.9952
- ค่า P: 0.000
เนื่องจากค่า p นี้น้อยกว่า 0.05 เราจึงสามารถปฏิเสธสมมติฐานว่างได้ กล่าวอีกนัยหนึ่ง มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างชั่วโมงเรียนกับคะแนนสอบ
ตัวอย่างที่ 2: การถดถอยเชิงเส้นพหุคูณ
สมมติว่าอาจารย์ต้องการใช้จำนวนชั่วโมงเรียนและจำนวนข้อสอบเตรียมสอบเพื่อคาดเดาเกรดที่นักเรียนจะได้รับในชั้นเรียน โดยรวบรวมข้อมูลจากนักเรียน 20 คนและเหมาะกับโมเดลการถดถอยเชิงเส้นพหุคูณ
ภาพหน้าจอต่อไปนี้แสดงผลลัพธ์ของแบบจำลองการถดถอย:

โมเดลการถดถอยเชิงเส้นพหุคูณที่ติดตั้งคือ:
คะแนนสอบ = 67.67 + 5.56*(ชั่วโมงเรียน) – 0.60*(สอบเตรียมสอบ)
เพื่อตรวจสอบว่ามีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างตัวแปรทำนายทั้งสองและตัวแปรตอบสนองหรือไม่ เราจำเป็นต้องวิเคราะห์ค่า F โดยรวมของแบบจำลองและค่า p ที่สอดคล้องกัน:
- ค่า F โดยรวม: 23.46
- ค่า P: 0.00
เนื่องจากค่า p นี้น้อยกว่า 0.05 เราจึงสามารถปฏิเสธสมมติฐานว่างได้ กล่าวอีกนัยหนึ่ง จำนวนชั่วโมงเรียนและการสอบเตรียมสอบมีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับผลการสอบ
หมายเหตุ: แม้ว่าค่า p-value สำหรับการสอบเตรียมอุดมศึกษา (p = 0.52) ไม่มีนัยสำคัญ แต่การสอบเตรียมอุดมศึกษา รวม กับจำนวนชั่วโมงเรียนมีความสัมพันธ์ที่สำคัญกับผลการสอบ
แหล่งข้อมูลเพิ่มเติม
ทำความเข้าใจการทดสอบ F สำหรับความสำคัญโดยรวมในการถดถอย
วิธีอ่านและตีความตารางการถดถอย
วิธีการรายงานผลการถดถอย
วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน Excel
วิธีการดำเนินการถดถอยเชิงเส้นหลายรายการใน Excel