ทำความเข้าใจสมมติฐานว่างสำหรับการถดถอยเชิงเส้น


การถดถอยเชิงเส้นเป็นเทคนิคที่เราสามารถใช้เพื่อทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรทำนายตั้งแต่หนึ่งตัวขึ้นไปกับ ตัวแปรตอบสนอง

หากเรามีตัวแปรทำนายเพียงตัวเดียวและตัวแปรตอบสนองหนึ่งตัว เราสามารถใช้ การถดถอยเชิงเส้นอย่างง่าย ซึ่งใช้สูตรต่อไปนี้เพื่อประมาณความสัมพันธ์ระหว่างตัวแปร:

ŷ = β 0 + β 1 x

ทอง:

  • ŷ: ค่าตอบกลับโดยประมาณ
  • β 0 : ค่าเฉลี่ยของ y เมื่อ x เป็นศูนย์
  • β 1 : การเปลี่ยนแปลงโดยเฉลี่ยใน y สัมพันธ์กับการเพิ่มขึ้นของ x หนึ่งหน่วย
  • x: ค่าของตัวแปรทำนาย

การถดถอยเชิงเส้นอย่างง่ายใช้สมมติฐานว่างและทางเลือกต่อไปนี้:

  • ชม 0 : β 1 = 0
  • HA : β 1 ≠ 0

สมมติฐานว่างระบุว่าสัมประสิทธิ์ β 1 เท่ากับศูนย์ กล่าวอีกนัยหนึ่ง ไม่มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างตัวแปรทำนาย x และตัวแปรตอบสนอง y

สมมติฐานทางเลือกระบุว่า β 1 ไม่ เท่ากับศูนย์ กล่าวอีกนัยหนึ่ง มี ความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่าง x และ y

หากเรามีตัวแปรทำนายหลายตัวและตัวแปรตอบสนองหนึ่งตัว เราสามารถใช้ การถดถอยเชิงเส้นหลายตัว ซึ่งใช้สูตรต่อไปนี้เพื่อประมาณความสัมพันธ์ระหว่างตัวแปร:

ŷ = β 0 + β 1 x 1 + β 2 x 2 + … + β k x k

ทอง:

  • ŷ: ค่าตอบกลับโดยประมาณ
  • β 0 : ค่าเฉลี่ยของ y เมื่อตัวแปรทำนายทั้งหมดมีค่าเท่ากับศูนย์
  • β i : การเปลี่ยนแปลงโดยเฉลี่ยใน y สัมพันธ์กับการเพิ่มขึ้นหนึ่งหน่วยใน x i
  • x i : ค่าของตัวแปรทำนาย x i

การถดถอยเชิงเส้นพหุคูณใช้สมมติฐานว่างและทางเลือกต่อไปนี้:

  • H 0 : β 1 = β 2 = … = β k = 0
  • HA : β 1 = β 2 = … = β k ≠ 0

สมมติฐานว่างระบุว่าสัมประสิทธิ์ทั้งหมดในแบบจำลองมีค่าเท่ากับศูนย์ กล่าวอีกนัยหนึ่ง ไม่มีตัวแปรทำนายใดที่มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับตัวแปรตอบสนอง y

สมมติฐานทางเลือกระบุว่าไม่ใช่ว่าสัมประสิทธิ์ทั้งหมดจะเท่ากับศูนย์พร้อมกัน

ตัวอย่างต่อไปนี้แสดงวิธีตัดสินใจว่าจะปฏิเสธหรือไม่ปฏิเสธสมมติฐานว่างในการถดถอยเชิงเส้นอย่างง่ายและแบบจำลองการถดถอยเชิงเส้นหลายตัว

ตัวอย่างที่ 1: การถดถอยเชิงเส้นอย่างง่าย

สมมติว่าอาจารย์ต้องการใช้จำนวนชั่วโมงเรียนเพื่อทำนายคะแนนสอบที่นักเรียนในชั้นเรียนจะได้ โดยรวบรวมข้อมูลจากนักเรียน 20 คนและเหมาะกับโมเดลการถดถอยเชิงเส้นอย่างง่าย

ภาพหน้าจอต่อไปนี้แสดงผลลัพธ์ของแบบจำลองการถดถอย:

เอาต์พุตการถดถอยเชิงเส้นอย่างง่ายใน Excel

โมเดลการถดถอยเชิงเส้นแบบง่ายที่ติดตั้งคือ:

คะแนนสอบ = 67.1617 + 5.2503*(ชั่วโมงเรียน)

เพื่อตรวจสอบว่ามีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างชั่วโมงที่เรียนกับคะแนนสอบหรือไม่ เราจำเป็นต้องวิเคราะห์ ค่า F โดยรวม ของแบบจำลองและค่า p ที่สอดคล้องกัน:

  • ค่า F โดยรวม: 47.9952
  • ค่า P: 0.000

เนื่องจากค่า p นี้น้อยกว่า 0.05 เราจึงสามารถปฏิเสธสมมติฐานว่างได้ กล่าวอีกนัยหนึ่ง มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างชั่วโมงเรียนกับคะแนนสอบ

ตัวอย่างที่ 2: การถดถอยเชิงเส้นพหุคูณ

สมมติว่าอาจารย์ต้องการใช้จำนวนชั่วโมงเรียนและจำนวนข้อสอบเตรียมสอบเพื่อคาดเดาเกรดที่นักเรียนจะได้รับในชั้นเรียน โดยรวบรวมข้อมูลจากนักเรียน 20 คนและเหมาะกับโมเดลการถดถอยเชิงเส้นพหุคูณ

ภาพหน้าจอต่อไปนี้แสดงผลลัพธ์ของแบบจำลองการถดถอย:

เอาต์พุตการถดถอยเชิงเส้นหลายรายการใน Excel

โมเดลการถดถอยเชิงเส้นพหุคูณที่ติดตั้งคือ:

คะแนนสอบ = 67.67 + 5.56*(ชั่วโมงเรียน) – 0.60*(สอบเตรียมสอบ)

เพื่อตรวจสอบว่ามีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างตัวแปรทำนายทั้งสองและตัวแปรตอบสนองหรือไม่ เราจำเป็นต้องวิเคราะห์ค่า F โดยรวมของแบบจำลองและค่า p ที่สอดคล้องกัน:

  • ค่า F โดยรวม: 23.46
  • ค่า P: 0.00

เนื่องจากค่า p นี้น้อยกว่า 0.05 เราจึงสามารถปฏิเสธสมมติฐานว่างได้ กล่าวอีกนัยหนึ่ง จำนวนชั่วโมงเรียนและการสอบเตรียมสอบมีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับผลการสอบ

หมายเหตุ: แม้ว่าค่า p-value สำหรับการสอบเตรียมอุดมศึกษา (p = 0.52) ไม่มีนัยสำคัญ แต่การสอบเตรียมอุดมศึกษา รวม กับจำนวนชั่วโมงเรียนมีความสัมพันธ์ที่สำคัญกับผลการสอบ

แหล่งข้อมูลเพิ่มเติม

ทำความเข้าใจการทดสอบ F สำหรับความสำคัญโดยรวมในการถดถอย
วิธีอ่านและตีความตารางการถดถอย
วิธีการรายงานผลการถดถอย
วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน Excel
วิธีการดำเนินการถดถอยเชิงเส้นหลายรายการใน Excel

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *