วิธีดำเนินการถดถอยแบบลำดับชั้นใน stata


การถดถอยแบบลำดับชั้น เป็นเทคนิคที่เราสามารถใช้เพื่อเปรียบเทียบแบบจำลองเชิงเส้นหลายแบบ

แนวคิดพื้นฐานคือ ก่อนอื่นเราจะปรับโมเดลการถดถอยเชิงเส้นด้วยตัวแปรอธิบายตัวเดียว ต่อไป เราจะปรับโมเดลการถดถอยอีกแบบหนึ่งโดยใช้ตัวแปรอธิบายเพิ่มเติม ถ้า R-squared (สัดส่วนของความแปรปรวนในตัวแปรตอบสนองที่สามารถอธิบายได้ด้วยตัวแปรอธิบาย) ในโมเดลที่สองนั้นสูงกว่า R-squared ในโมเดลก่อนหน้าอย่างมาก นั่นหมายความว่าโมเดลที่สองดีกว่า

จากนั้นเราจะทำซ้ำขั้นตอนการปรับแบบจำลองการถดถอยเพิ่มเติมให้เหมาะสมด้วยตัวแปรที่อธิบายได้มากขึ้น และดูว่ารุ่นที่ใหม่กว่ามีการปรับปรุงมากกว่ารุ่นก่อนหน้าหรือไม่

บทช่วยสอนนี้ให้ตัวอย่างวิธีการถดถอยแบบลำดับชั้นใน Stata

ตัวอย่าง: การถดถอยแบบลำดับชั้นใน Stata

เราจะใช้ชุดข้อมูลในตัวที่เรียกว่า อัตโนมัติ เพื่อแสดงวิธีการถดถอยแบบลำดับชั้นใน Stata ขั้นแรก โหลดชุดข้อมูลโดยพิมพ์ข้อความต่อไปนี้ในกล่องคำสั่ง:

การใช้งานระบบอัตโนมัติ

เราสามารถรับข้อมูลสรุปโดยย่อโดยใช้คำสั่งต่อไปนี้:

เพื่อสรุป

สรุปชุดข้อมูลอัตโนมัติใน Stata

เราจะเห็นได้ว่าชุดข้อมูลประกอบด้วยตัวแปรต่างๆ 12 ตัว รวมทั้งหมด 74 คัน

เราจะปรับโมเดลการถดถอยเชิงเส้นสามแบบต่อไปนี้ให้เหมาะสม และใช้การถดถอยแบบลำดับชั้นเพื่อดูว่าแต่ละโมเดลที่ตามมามีการปรับปรุงที่สำคัญจากรุ่นก่อนหน้าหรือไม่:

รุ่น 1: ราคา = การสกัดกั้น + MPG

รุ่น 2: ราคา = ค่าตัด + mpg + น้ำหนัก

รุ่น 3: ราคา = อินเตอร์เซปต์ + ไมล์ต่อเกียร์ + น้ำหนัก + อัตราทดเกียร์

เพื่อดำเนินการถดถอยแบบลำดับชั้นใน Stata เราจะต้องติดตั้งแพ็คเกจ Hireg ก่อน เมื่อต้องการทำเช่นนี้ พิมพ์ต่อไปนี้ในกล่องคำสั่ง:

ตามหาเฮียเร็ก

ในหน้าต่างที่ปรากฏขึ้น ให้คลิกที่ Hireg จาก https://fmwww.bc.edu/RePEc/bocode/h

ติดตั้งแพ็คเกจ Hireg ใน Stata

ในหน้าต่างถัดไป คลิกลิงก์ที่ระบุว่า คลิกที่นี่เพื่อติดตั้ง

แพ็คเกจจะติดตั้งภายในไม่กี่วินาที จากนั้น เพื่อทำการถดถอยแบบลำดับชั้น เราจะใช้คำสั่งต่อไปนี้:

ราคาเช่า (mpg) (น้ำหนัก) (gear_ratio)

นี่คือสิ่งที่ขอให้ Stata ทำ:

  • ดำเนินการถดถอยแบบลำดับชั้นโดยใช้ ราคา เป็นตัวแปรตอบสนองในแต่ละรุ่น
  • สำหรับรุ่นแรก ให้ใช้ mpg เป็นตัวแปรอธิบาย
  • สำหรับรุ่นที่สอง ให้เพิ่ม น้ำหนัก เป็นตัวแปรอธิบายเพิ่มเติม
  • สำหรับรุ่นที่สาม ให้เพิ่ม gear_ratio เป็นตัวแปรอธิบายอีกตัวแปรหนึ่ง

นี่คือผลลัพธ์ของรุ่นแรก:

เอาต์พุตการถดถอยลำดับชั้นใน Stata

เราจะเห็นว่าค่า R-squared ของแบบจำลองคือ 0.2196 และค่า p-value โดยรวม (Prob > F) ของแบบจำลองคือ 0.0000 ซึ่งมีนัยสำคัญทางสถิติที่ α = 0.05

ต่อไปเราจะเห็นผลลัพธ์ของโมเดลที่สอง:

เอาต์พุตการถดถอยลำดับชั้นของโมเดลที่สองใน Stata

ค่า R ของรุ่นนี้คือ 0.2934 ซึ่งมากกว่าค่าของรุ่นแรก เพื่อตรวจสอบว่าความแตกต่างนี้มีนัยสำคัญทางสถิติหรือไม่ Stata ได้ทำการทดสอบ F ซึ่งให้ตัวเลขต่อไปนี้ที่ด้านล่างของผลลัพธ์:

  • R กำลังสองผลต่างระหว่างทั้งสองรุ่น = 0.074
  • สถิติ F สำหรับผลต่าง = 7.416
  • ค่า p ที่สอดคล้องกันของสถิติ F = 0.008

เนื่องจากค่า p น้อยกว่า 0.05 เราจึงสรุปได้ว่ามีการปรับปรุงที่มีนัยสำคัญทางสถิติในแบบจำลองที่สองเมื่อเปรียบเทียบกับแบบจำลองแรก

สุดท้ายนี้ เราจะเห็นผลลัพธ์ของโมเดลที่สาม:

การถดถอยแบบลำดับชั้นในการตีความสเตตา

ค่า R ของรุ่นนี้คือ 0.3150 ซึ่งมากกว่าค่าของรุ่นที่สอง เพื่อตรวจสอบว่าความแตกต่างนี้มีนัยสำคัญทางสถิติหรือไม่ Stata ได้ทำการทดสอบ F ซึ่งให้ตัวเลขต่อไปนี้ที่ด้านล่างของผลลัพธ์:

  • R กำลังสองผลต่างระหว่างทั้งสองรุ่น = 0.022
  • สถิติ F สำหรับผลต่าง = 2.206
  • ค่า p ที่สอดคล้องกันของสถิติ F = 0.142

เนื่องจากค่า p ไม่น้อยกว่า 0.05 เราจึงไม่มีหลักฐานเพียงพอที่จะกล่าวว่าแบบจำลองที่สามมีการปรับปรุงมากกว่าแบบจำลองที่สอง

ในตอนท้ายของผลลัพธ์ เราจะเห็นว่า Stata ให้ข้อมูลสรุปของผลลัพธ์:

การถดถอยแบบลำดับชั้นส่งผลให้เกิด Stata

ในตัวอย่างนี้ เราจะสรุปได้ว่าโมเดล 2 นำเสนอการปรับปรุงที่สำคัญเหนือโมเดล 1 แต่โมเดล 3 ไม่ได้เสนอการปรับปรุงที่สำคัญเหนือโมเดล 2

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *