วิธีใช้ข้อผิดพลาดมาตรฐานที่แข็งแกร่งในการถดถอยใน stata


การถดถอยเชิงเส้นพหุคูณ เป็นวิธีการที่เราสามารถใช้เพื่อทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรอธิบายหลายตัวและตัวแปรตอบสนอง

น่าเสียดายที่ปัญหาที่มักเกิดขึ้นในการถดถอยเรียกว่า เฮเทอโรสซิดาสติกซิตี ซึ่งมีการเปลี่ยนแปลงอย่างเป็นระบบในด้านความแปรปรวนของค่าคงเหลือในช่วงของค่าที่วัดได้

สิ่งนี้นำไปสู่การเพิ่มขึ้นของความแปรปรวนของการประมาณค่าสัมประสิทธิ์การถดถอย แต่แบบจำลองการถดถอยไม่ได้คำนึงถึงสิ่งนี้ ซึ่งทำให้มีโอกาสมากขึ้นที่แบบจำลองการถดถอยจะอ้างว่าคำในแบบจำลองนั้นมีนัยสำคัญทางสถิติ ทั้งที่ในความเป็นจริงกลับไม่มีนัยสำคัญ

วิธีหนึ่งในการอธิบายปัญหานี้คือการใช้ ข้อผิดพลาดมาตรฐานที่เข้มงวด ซึ่งจะ “แข็งแกร่ง” มากกว่าสำหรับปัญหาแบบเฮเทอโรสเกดาสติก และมีแนวโน้มที่จะให้การวัดข้อผิดพลาดมาตรฐานที่แท้จริงของค่าสัมประสิทธิ์การถดถอยได้แม่นยำยิ่งขึ้น

บทช่วยสอนนี้จะอธิบายวิธีใช้ข้อผิดพลาดมาตรฐานที่แข็งแกร่งในการวิเคราะห์การถดถอยใน Stata

ตัวอย่าง: ข้อผิดพลาดมาตรฐานที่แข็งแกร่งใน Stata

เราจะใช้ชุดข้อมูล Stata ที่ผสานรวม โดยอัตโนมัติ เพื่อแสดงวิธีใช้ข้อผิดพลาดมาตรฐานที่เข้มงวดในการถดถอย

ขั้นตอนที่ 1: โหลดและแสดงข้อมูล

ขั้นแรก ให้ใช้คำสั่งต่อไปนี้เพื่อโหลดข้อมูล:

การใช้งานระบบอัตโนมัติ

จากนั้นแสดงข้อมูลดิบโดยใช้คำสั่งต่อไปนี้:

พี่ชาย

ชุดข้อมูลอัตโนมัติใน Stata

ขั้นตอนที่ 2: ดำเนินการถดถอยเชิงเส้นหลายรายการโดยไม่มีข้อผิดพลาดมาตรฐานที่แข็งแกร่ง

ต่อไป เราจะป้อนคำสั่งต่อไปนี้เพื่อทำการถดถอยเชิงเส้นพหุคูณโดยใช้ ราคา เป็นตัวแปรตอบสนอง และใช้ mpg และ น้ำหนัก เป็นตัวแปรอธิบาย:

ราคาถดถอย mpg น้ำหนัก

เอาต์พุตการถดถอยหลายรายการใน Stata

ขั้นตอนที่ 3: ดำเนินการถดถอยเชิงเส้นหลายรายการโดยใช้ข้อผิดพลาดมาตรฐานที่แข็งแกร่ง

ตอนนี้เราจะทำการถดถอยเชิงเส้นพหุคูณแบบเดียวกันทุกประการ แต่คราวนี้เราจะใช้คำสั่ง vce(robust) เพื่อให้ Stata รู้วิธีใช้ข้อผิดพลาดมาตรฐานที่แข็งแกร่ง:

ราคาถดถอย mpg น้ำหนัก, vce (แข็งแกร่ง)

ข้อผิดพลาดมาตรฐานที่แข็งแกร่งใน Stata

มีสิ่งที่น่าสนใจบางประการที่ควรทราบที่นี่:

1. การประมาณค่าสัมประสิทธิ์ยังคงเหมือนเดิม เมื่อเราใช้ข้อผิดพลาดมาตรฐานที่เข้มงวด การประมาณค่าสัมประสิทธิ์จะไม่เปลี่ยนแปลงเลย โปรดทราบว่าการประมาณค่าสัมประสิทธิ์สำหรับ MPG น้ำหนัก และค่าคงที่จะเป็นดังนี้สำหรับการถดถอยทั้งสอง:

  • mpg: -49.51222
  • น้ำหนัก: 1.746559
  • _ต่อ: 1946.069

2. ข้อผิดพลาดมาตรฐานมีการเปลี่ยนแปลง โปรดทราบว่าเมื่อเราใช้ข้อผิดพลาดมาตรฐานที่เข้มงวด ข้อผิดพลาดมาตรฐานสำหรับการประมาณค่าสัมประสิทธิ์แต่ละรายการจะเพิ่มขึ้น

หมายเหตุ: ในกรณีส่วนใหญ่ ข้อผิดพลาดมาตรฐานที่เข้มงวดจะมีขนาดใหญ่กว่าข้อผิดพลาดมาตรฐานปกติ แต่ในบางกรณีที่เกิดขึ้นไม่บ่อยนัก อาจเป็นไปได้ว่าข้อผิดพลาดมาตรฐานที่เข้มงวดจะมีขนาดเล็กลง

3. สถิติการทดสอบของแต่ละสัมประสิทธิ์มีการเปลี่ยนแปลง โปรดทราบว่าค่าสัมบูรณ์ของสถิติการทดสอบแต่ละรายการ t ลดลง ผลก็คือ สถิติการทดสอบจะคำนวณเป็นค่าสัมประสิทธิ์โดยประมาณหารด้วยข้อผิดพลาดมาตรฐาน ดังนั้น ยิ่งค่าความผิดพลาดมาตรฐานมาก ค่าสัมบูรณ์ของสถิติการทดสอบก็จะยิ่งน้อยลง

4. ค่า p มีการเปลี่ยนแปลง โปรดทราบว่าค่า p สำหรับแต่ละตัวแปรก็เพิ่มขึ้นเช่นกัน เนื่องจากสถิติการทดสอบที่น้อยกว่าจะสัมพันธ์กับค่า p ที่มากกว่า

แม้ว่าค่า p จะเปลี่ยนไปสำหรับสัมประสิทธิ์ของเรา แต่ตัวแปร mpg ก็ยังไม่มีนัยสำคัญทางสถิติที่ α = 0.05 และ น้ำหนัก ตัวแปรยังคงมีนัยสำคัญทางสถิติที่ α = 0.05

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *