วิธีดำเนินการถดถอยกำลังสองใน stata


เมื่อตัวแปรสองตัวมีความสัมพันธ์เชิงเส้น คุณมักจะใช้ การถดถอยเชิงเส้นอย่างง่าย เพื่อหาปริมาณความสัมพันธ์ได้

ตัวอย่างความสัมพันธ์เชิงเส้น

อย่างไรก็ตาม เมื่อตัวแปรสองตัวมีความสัมพันธ์แบบกำลังสอง คุณสามารถใช้ การถดถอยกำลังสอง เพื่อหาปริมาณความสัมพันธ์ของตัวแปรทั้งสองได้

ตัวอย่างความสัมพันธ์กำลังสอง

บทช่วยสอนนี้จะอธิบายวิธีการถดถอยกำลังสองใน Stata

ตัวอย่าง: การถดถอยกำลังสองใน Stata

สมมติว่าเราต้องการเข้าใจความสัมพันธ์ระหว่างจำนวนชั่วโมงทำงานกับความสุข เรามีข้อมูลเกี่ยวกับจำนวนชั่วโมงทำงานต่อสัปดาห์และรายงานระดับความสุข (ในระดับ 0 ถึง 100) สำหรับคน 16 คนดังต่อไปนี้:

ชุดข้อมูลการถดถอยกำลังสองใน Stata

คุณสามารถสร้างตัวอย่างนี้ขึ้นมาใหม่ได้โดยการป้อนข้อมูลที่แน่นอนนี้ลงใน Stata โดยใช้ ข้อมูล > ตัวแก้ไขข้อมูล > ตัวแก้ไขข้อมูล (แก้ไข) ในเมนูด้านบน

ใช้ขั้นตอนต่อไปนี้เพื่อดำเนินการถดถอยกำลังสองใน Stata

ขั้นตอนที่ 1: แสดงภาพข้อมูล

ก่อนที่เราจะใช้การถดถอยกำลังสอง เราต้องแน่ใจว่าความสัมพันธ์ระหว่างตัวแปรอธิบาย (ชั่วโมง) และตัวแปรตอบสนอง (ความสุข) นั้นเป็นกำลังสองจริงๆ เรามาแสดงภาพข้อมูลโดยใช้ Scatterplot โดยพิมพ์ข้อความต่อไปนี้ลงในกล่อง Command:

กระจายชั่วโมงแห่งความสุข

สิ่งนี้จะสร้างพล็อตกระจายต่อไปนี้:

แผนกระจายกำลังสองใน Stata

เราจะเห็นได้ว่าความสุขมีแนวโน้มที่จะเพิ่มขึ้นเมื่อจำนวนชั่วโมงทำงานเพิ่มขึ้นจากศูนย์ถึงจุดหนึ่ง แต่จากนั้นก็เริ่มลดลงเมื่อจำนวนชั่วโมงทำงานเกินประมาณ 30 ชั่วโมง

รูปร่างตัว “U” กลับหัวในแผนภาพกระจายนี้บ่งชี้ว่ามีความสัมพันธ์กำลังสองระหว่างชั่วโมงทำงานกับความสุข ซึ่งหมายความว่าเราควรใช้การถดถอยกำลังสองเพื่อหาปริมาณความสัมพันธ์นี้

ขั้นตอนที่ 2: ดำเนินการถดถอยกำลังสอง

ก่อนที่จะปรับแบบจำลองการถดถอยกำลังสองให้กับข้อมูล เราจำเป็นต้องสร้างตัวแปรใหม่สำหรับค่ากำลังสองของตัวแปรตัวทำนาย ชั่วโมง ของเรา เราสามารถทำได้โดยพิมพ์ข้อความต่อไปนี้ลงในกล่องคำสั่ง:

Gen hours2 = ชั่วโมง*ชั่วโมง

เราสามารถดูตัวแปรใหม่นี้ได้โดยไปที่ Data > Data Editor > Data Editor (Browse) จากเมนูด้านบน

การถดถอยกำลังสองใน Stata

เราจะเห็นว่าชั่วโมง2 เป็นเพียงชั่วโมงกำลังสอง ขณะนี้เราสามารถทำการถดถอยกำลังสองโดยใช้ ชั่วโมง และ ชั่วโมง2 เป็นตัวแปรอธิบาย และใช้ ความสุข เป็นตัวแปรตอบสนอง เมื่อต้องการดำเนินการถดถอยกำลังสอง พิมพ์ต่อไปนี้ในกล่องคำสั่ง:

ชั่วโมงแห่งความสุข2

เอาต์พุตการถดถอยกำลังสองใน Stata

วิธีการตีความตัวเลขที่น่าสนใจที่สุดในผลลัพธ์มีดังนี้:

ปัญหา> F: 0.000 นี่คือค่า p สำหรับการถดถอยโดยรวม เนื่องจากค่านี้น้อยกว่า 0.05 ซึ่งหมายความว่า ชั่วโมง และ ชั่วโมงที่ 2 ของตัวแปรทำนายรวมกันมีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับ ความสุข ของตัวแปรตอบสนอง

R กำลังสอง: 0.9092 นี่คือสัดส่วนของความแปรปรวนในตัวแปรตอบสนองที่สามารถอธิบายได้ด้วยตัวแปรอธิบาย ในตัวอย่างนี้ ความแปรผันของความสุข 90.92% สามารถอธิบายเป็น ชั่วโมง และ ชั่วโมง 2 ได้

สมการการถดถอย: เราสามารถสร้างสมการถดถอยโดยใช้ค่าสัมประสิทธิ์ที่แสดงในตารางผลลัพธ์ ในกรณีนี้ สมการจะเป็นดังนี้:

ความสุขที่ทำนายไว้ = -30.25287 + 7.173061 (ชั่วโมง) – 0.1069887 ( 2 ชั่วโมง)

เราสามารถใช้สมการนี้เพื่อค้นหาความสุขที่คาดการณ์ไว้ของแต่ละคน โดยพิจารณาจากจำนวนชั่วโมงทำงานต่อสัปดาห์

เช่น คนที่ทำงาน 60 ชั่วโมงต่อสัปดาห์ควรมีระดับความสุขอยู่ที่ 14.97:

ความสุขที่ทำนายไว้ = -30.25287 + 7.173061(60) – .1069887(60 2 ) = 14.97

ในทางกลับกัน คนที่ทำงาน 30 ชั่วโมงต่อ สัปดาห์ควรมีระดับความสุขอยู่ที่ 88.65

ความสุขที่ทำนายไว้ = -30.25287 + 7.173061(30) – .1069887(30 2 ) = 88.65

ขั้นตอนที่ 3: รายงานผลลัพธ์

สุดท้ายนี้ เราต้องการรายงานผลลัพธ์ของการถดถอยกำลังสองของเรา นี่คือตัวอย่างของวิธีการทำเช่นนี้:

การถดถอยกำลังสองดำเนินการเพื่อหาปริมาณความสัมพันธ์ระหว่างจำนวนชั่วโมงที่แต่ละคนทำงานและระดับความสุขที่สอดคล้องกัน (วัดจาก 0 ถึง 100) ใช้กลุ่มตัวอย่างจำนวน 16 คนในการวิเคราะห์

ผลการวิจัยพบว่ามีความสัมพันธ์อย่างมีนัยสำคัญทางสถิติระหว่างตัวแปรอธิบาย ชั่วโมง และ ชั่วโมงที่ 2 กับ ความสุข ของตัวแปรตอบสนอง (F(2, 13) = 65.09, p < 0.0001)

ตัวแปรอธิบายทั้งสองนี้รวมกันคิดเป็น 90.92% ของตัวแปรอธิบายความสุข

สมการถดถอยกลายเป็น:

ความสุขที่ทำนายไว้ = -30.25287 + 7.173061 (ชั่วโมง) – 0.1069887 ( 2 ชั่วโมง)

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *