วิธีทดสอบความสำคัญของความชันการถดถอย


สมมติว่าเรามีชุดข้อมูลต่อไปนี้ซึ่งแสดงพื้นที่เป็นตารางฟุตและราคาของบ้าน 12 หลังที่แตกต่างกัน:

ตัวอย่างการถดถอยเชิงเส้นอย่างง่าย

เราต้องการทราบว่ามีความสัมพันธ์ที่สำคัญระหว่างพื้นที่เป็นตารางฟุตและราคาหรือไม่

เพื่อให้เข้าใจว่าข้อมูลมีลักษณะอย่างไร ขั้นแรกเราจะสร้างแผนภาพกระจายที่มี ตารางฟุต บนแกน x และ ราคา บนแกน y:

พล็อตกระจายการถดถอยเชิงเส้นอย่างง่าย

เราจะเห็นได้อย่างชัดเจนว่ามีความสัมพันธ์เชิงบวกระหว่างพื้นที่เป็นตารางฟุตและราคา เมื่อพื้นที่เป็นตารางฟุตเพิ่มขึ้น ราคาบ้านก็มีแนวโน้มเพิ่มขึ้นเช่นกัน

อย่างไรก็ตาม หากต้องการทราบว่ามี ความสัมพันธ์ ที่มีนัยสำคัญทางสถิติ ระหว่างพื้นที่เป็นตารางฟุตและราคาหรือไม่ เราจำเป็นต้องเรียกใช้การถดถอยเชิงเส้นอย่างง่าย

ดังนั้นเราจึงใช้ การถดถอยเชิงเส้นอย่างง่าย โดยใช้ ตารางฟุต เป็นตัวทำนายและ ราคาเป็นการ ตอบสนอง และได้ผลลัพธ์ดังต่อไปนี้:

เอาต์พุตการถดถอยเชิงเส้นอย่างง่าย

ไม่ว่าคุณจะรันการถดถอยเชิงเส้นอย่างง่ายใน Excel, SPSS, R หรือซอฟต์แวร์อื่นๆ คุณจะได้ผลลัพธ์ที่คล้ายกับที่แสดงด้านบน

โปรดจำไว้ว่าการถดถอยเชิงเส้นอย่างง่ายจะสร้างเส้นที่เหมาะสมที่สุด ซึ่งเป็นสมการของเส้นที่ “พอดี” กับข้อมูลในแผนภาพกระจายของเรามากที่สุด เส้นที่เหมาะสมที่สุดนี้ถูกกำหนดเป็น:

ŷ = ข 0 + ข 1 x

โดยที่ ŷ คือค่าทำนายของตัวแปรตอบสนอง b 0 คือจุดตัด b 1 คือสัมประสิทธิ์การถดถอย และ x คือค่าของตัวแปรทำนาย

ค่าของ b 0 กำหนดโดยสัมประสิทธิ์ของแหล่งกำเนิดซึ่งก็คือ 47588.70

ค่าของ b 1 กำหนดโดยสัมประสิทธิ์ของตัวแปรทำนาย Square Feet ซึ่งก็คือ 93.57

ดังนั้น เส้นตรงที่เหมาะสมที่สุดในตัวอย่างนี้คือ ŷ = 47588.70+ 93.57x

วิธีตีความบรรทัดที่เหมาะที่สุดนี้:

  • b 0 : เมื่อค่าตารางฟุตเป็นศูนย์ มูลค่าราคาเฉลี่ยที่คาดหวังคือ 47,588.70 ดอลลาร์ (ในกรณีนี้ การตีความค่าตัดขวางนั้นไม่สมเหตุสมผล เนื่องจากบ้านไม่มีพื้นที่เป็นศูนย์ตารางฟุตได้)
  • b 1 : สำหรับแต่ละตารางฟุตเพิ่มเติม ราคาเฉลี่ยที่คาดว่าจะเพิ่มขึ้นคือ 93.57 ดอลลาร์

ตอนนี้เรารู้แล้วว่าราคาที่เพิ่มขึ้นโดยเฉลี่ยที่คาดหวังคือ 93.57 ดอลลาร์ต่อตารางฟุตที่เพิ่มขึ้นแต่ละตารางฟุต

หากต้องการทราบว่าการเพิ่มขึ้นนี้มีนัยสำคัญทางสถิติหรือไม่ เราจำเป็นต้องทำการทดสอบสมมติฐานสำหรับ B 1 หรือสร้างช่วงความเชื่อมั่นสำหรับ B 1

หมายเหตุ : การทดสอบสมมติฐานและช่วงความเชื่อมั่นจะให้ผลลัพธ์ที่เหมือนกันเสมอ

การสร้างช่วงความเชื่อมั่นสำหรับความชันการถดถอย

ในการสร้างช่วงความเชื่อมั่นสำหรับความชันการถดถอย เราใช้สูตรต่อไปนี้:

ช่วงความเชื่อมั่น = b 1 +/- (t 1-∝/2, n-2 ) * (ข้อผิดพลาดมาตรฐานของ b 1 )

ทอง:

  • b 1 คือค่าสัมประสิทธิ์ความชันที่กำหนดในผลการถดถอย
  • (t 1-∝/2, n-2 ) คือค่า t วิกฤตสำหรับระดับความเชื่อมั่น 1-∝ โดยมีดีกรีอิสระ n-2 โดยที่ n คือจำนวนการสังเกตทั้งหมดในชุดข้อมูลของเรา
  • (ข้อผิดพลาดมาตรฐานของ b 1 ) คือข้อผิดพลาดมาตรฐานของ b 1 ที่กำหนดในผลลัพธ์การถดถอย

สำหรับตัวอย่างของเรา ต่อไปนี้เป็นวิธีสร้างช่วงความเชื่อมั่น 95% สำหรับ B 1 :

  • b 1 คือ 93.57 จากเอาต์พุตการถดถอย
  • เนื่องจากเราใช้ช่วงความเชื่อมั่น 95% ∝ = 0.05 และ n-2 = 12-2 = 10 ดังนั้น t 0.975, 10 คือ 2.228 ตามตารางการกระจาย t
  • (ข้อผิดพลาดมาตรฐานของ b1 ) คือ 11.45 จากเอาต์พุตการถดถอย

ดังนั้น ช่วงความมั่นใจ 95% ของเราสำหรับ B 1 คือ:

93.57 +/- (2.228) * (11.45) = (68.06, 119.08)

ซึ่งหมายความว่าเรามั่นใจ 95% ว่าราคาเฉลี่ยที่เพิ่มขึ้นจริงสำหรับแต่ละตารางฟุตเพิ่มเติมจะอยู่ระหว่าง 68.06 ถึง 119.08 ดอลลาร์

โปรดทราบว่า $0 ไม่ได้อยู่ในช่วงนี้ ดังนั้นความสัมพันธ์ระหว่างพื้นที่เป็นตารางฟุตและราคาจึงมีนัยสำคัญทางสถิติที่ระดับความเชื่อมั่น 95%

ทำการทดสอบสมมติฐานสำหรับความชันการถดถอย

ในการทำการทดสอบสมมติฐานสำหรับความชันการถดถอย เราจะปฏิบัติตาม ขั้นตอนมาตรฐาน 5 ขั้นตอนสำหรับการทดสอบสมมติฐานใดๆ :

ขั้นตอนที่ 1 ระบุสมมติฐาน

สมมติฐานว่าง (H0): B 1 = 0

สมมติฐานทางเลือก: (ฮา): B 1 ≠ 0

ขั้นตอนที่ 2 กำหนดระดับนัยสำคัญที่จะใช้

เนื่องจากเราสร้างช่วงความเชื่อมั่น 95% ในตัวอย่างก่อนหน้านี้ เราจะใช้แนวทางที่เทียบเท่าที่นี่และเลือกใช้ระดับนัยสำคัญที่ 0.05

ขั้นตอนที่ 3 ค้นหาสถิติการทดสอบและค่า p ที่สอดคล้องกัน

ในกรณีนี้ สถิติการทดสอบคือ t = สัมประสิทธิ์ของ b 1 / ค่าคลาดเคลื่อนมาตรฐานของ b 1 โดยมีดีกรีอิสระ n-2 เราสามารถหาค่าเหล่านี้ได้จากผลการถดถอย:

เอาต์พุตการถดถอยเชิงเส้นอย่างง่าย
ดังนั้นสถิติการทดสอบ t = 92.89 / 13.88 = 6.69

การใช้ เครื่องคำนวณคะแนน T ถึงค่า P ด้วยคะแนน 6.69 พร้อมความอิสระ 10 องศาและการทดสอบแบบสองด้าน ค่า p = 0.000

ขั้นตอนที่ 4 ปฏิเสธหรือไม่ปฏิเสธสมมติฐานว่าง

เนื่องจากค่า p ต่ำกว่าระดับนัยสำคัญของเราที่ 0.05 เราจึงปฏิเสธสมมติฐานว่าง

ขั้นตอนที่ 5 ตีความผลลัพธ์

เนื่องจากเราปฏิเสธสมมติฐานว่าง เรามีหลักฐานเพียงพอที่จะบอกว่าราคาที่เพิ่มขึ้นโดยเฉลี่ยที่แท้จริงสำหรับแต่ละตารางฟุตเพิ่มเติมนั้นไม่เป็นศูนย์

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *