วิธีดำเนินการถดถอยกำลังสองใน stata
เมื่อตัวแปรสองตัวมีความสัมพันธ์เชิงเส้น คุณมักจะใช้ การถดถอยเชิงเส้นอย่างง่าย เพื่อหาปริมาณความสัมพันธ์ได้
อย่างไรก็ตาม เมื่อตัวแปรสองตัวมีความสัมพันธ์แบบกำลังสอง คุณสามารถใช้ การถดถอยกำลังสอง เพื่อหาปริมาณความสัมพันธ์ของตัวแปรทั้งสองได้
บทช่วยสอนนี้จะอธิบายวิธีการถดถอยกำลังสองใน Stata
ตัวอย่าง: การถดถอยกำลังสองใน Stata
สมมติว่าเราต้องการเข้าใจความสัมพันธ์ระหว่างจำนวนชั่วโมงทำงานกับความสุข เรามีข้อมูลเกี่ยวกับจำนวนชั่วโมงทำงานต่อสัปดาห์และรายงานระดับความสุข (ในระดับ 0 ถึง 100) สำหรับคน 16 คนดังต่อไปนี้:
คุณสามารถสร้างตัวอย่างนี้ขึ้นมาใหม่ได้โดยการป้อนข้อมูลที่แน่นอนนี้ลงใน Stata โดยใช้ ข้อมูล > ตัวแก้ไขข้อมูล > ตัวแก้ไขข้อมูล (แก้ไข) ในเมนูด้านบน
ใช้ขั้นตอนต่อไปนี้เพื่อดำเนินการถดถอยกำลังสองใน Stata
ขั้นตอนที่ 1: แสดงภาพข้อมูล
ก่อนที่เราจะใช้การถดถอยกำลังสอง เราต้องแน่ใจว่าความสัมพันธ์ระหว่างตัวแปรอธิบาย (ชั่วโมง) และตัวแปรตอบสนอง (ความสุข) นั้นเป็นกำลังสองจริงๆ เรามาแสดงภาพข้อมูลโดยใช้ Scatterplot โดยพิมพ์ข้อความต่อไปนี้ลงในกล่อง Command:
กระจายชั่วโมงแห่งความสุข
สิ่งนี้จะสร้างพล็อตกระจายต่อไปนี้:
เราจะเห็นได้ว่าความสุขมีแนวโน้มที่จะเพิ่มขึ้นเมื่อจำนวนชั่วโมงทำงานเพิ่มขึ้นจากศูนย์ถึงจุดหนึ่ง แต่จากนั้นก็เริ่มลดลงเมื่อจำนวนชั่วโมงทำงานเกินประมาณ 30 ชั่วโมง
รูปร่างตัว “U” กลับหัวในแผนภาพกระจายนี้บ่งชี้ว่ามีความสัมพันธ์กำลังสองระหว่างชั่วโมงทำงานกับความสุข ซึ่งหมายความว่าเราควรใช้การถดถอยกำลังสองเพื่อหาปริมาณความสัมพันธ์นี้
ขั้นตอนที่ 2: ดำเนินการถดถอยกำลังสอง
ก่อนที่จะปรับแบบจำลองการถดถอยกำลังสองให้กับข้อมูล เราจำเป็นต้องสร้างตัวแปรใหม่สำหรับค่ากำลังสองของตัวแปรตัวทำนาย ชั่วโมง ของเรา เราสามารถทำได้โดยพิมพ์ข้อความต่อไปนี้ลงในกล่องคำสั่ง:
Gen hours2 = ชั่วโมง*ชั่วโมง
เราสามารถดูตัวแปรใหม่นี้ได้โดยไปที่ Data > Data Editor > Data Editor (Browse) จากเมนูด้านบน
เราจะเห็นว่าชั่วโมง2 เป็นเพียงชั่วโมงกำลังสอง ขณะนี้เราสามารถทำการถดถอยกำลังสองโดยใช้ ชั่วโมง และ ชั่วโมง2 เป็นตัวแปรอธิบาย และใช้ ความสุข เป็นตัวแปรตอบสนอง เมื่อต้องการดำเนินการถดถอยกำลังสอง พิมพ์ต่อไปนี้ในกล่องคำสั่ง:
ชั่วโมงแห่งความสุข2
วิธีการตีความตัวเลขที่น่าสนใจที่สุดในผลลัพธ์มีดังนี้:
ปัญหา> F: 0.000 นี่คือค่า p สำหรับการถดถอยโดยรวม เนื่องจากค่านี้น้อยกว่า 0.05 ซึ่งหมายความว่า ชั่วโมง และ ชั่วโมงที่ 2 ของตัวแปรทำนายรวมกันมีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับ ความสุข ของตัวแปรตอบสนอง
R กำลังสอง: 0.9092 นี่คือสัดส่วนของความแปรปรวนในตัวแปรตอบสนองที่สามารถอธิบายได้ด้วยตัวแปรอธิบาย ในตัวอย่างนี้ ความแปรผันของความสุข 90.92% สามารถอธิบายเป็น ชั่วโมง และ ชั่วโมง 2 ได้
สมการการถดถอย: เราสามารถสร้างสมการถดถอยโดยใช้ค่าสัมประสิทธิ์ที่แสดงในตารางผลลัพธ์ ในกรณีนี้ สมการจะเป็นดังนี้:
ความสุขที่ทำนายไว้ = -30.25287 + 7.173061 (ชั่วโมง) – 0.1069887 ( 2 ชั่วโมง)
เราสามารถใช้สมการนี้เพื่อค้นหาความสุขที่คาดการณ์ไว้ของแต่ละคน โดยพิจารณาจากจำนวนชั่วโมงทำงานต่อสัปดาห์
เช่น คนที่ทำงาน 60 ชั่วโมงต่อสัปดาห์ควรมีระดับความสุขอยู่ที่ 14.97:
ความสุขที่ทำนายไว้ = -30.25287 + 7.173061(60) – .1069887(60 2 ) = 14.97
ในทางกลับกัน คนที่ทำงาน 30 ชั่วโมงต่อ สัปดาห์ควรมีระดับความสุขอยู่ที่ 88.65
ความสุขที่ทำนายไว้ = -30.25287 + 7.173061(30) – .1069887(30 2 ) = 88.65
ขั้นตอนที่ 3: รายงานผลลัพธ์
สุดท้ายนี้ เราต้องการรายงานผลลัพธ์ของการถดถอยกำลังสองของเรา นี่คือตัวอย่างของวิธีการทำเช่นนี้:
การถดถอยกำลังสองดำเนินการเพื่อหาปริมาณความสัมพันธ์ระหว่างจำนวนชั่วโมงที่แต่ละคนทำงานและระดับความสุขที่สอดคล้องกัน (วัดจาก 0 ถึง 100) ใช้กลุ่มตัวอย่างจำนวน 16 คนในการวิเคราะห์
ผลการวิจัยพบว่ามีความสัมพันธ์อย่างมีนัยสำคัญทางสถิติระหว่างตัวแปรอธิบาย ชั่วโมง และ ชั่วโมงที่ 2 กับ ความสุข ของตัวแปรตอบสนอง (F(2, 13) = 65.09, p < 0.0001)
ตัวแปรอธิบายทั้งสองนี้รวมกันคิดเป็น 90.92% ของตัวแปรอธิบายความสุข
สมการถดถอยกลายเป็น:
ความสุขที่ทำนายไว้ = -30.25287 + 7.173061 (ชั่วโมง) – 0.1069887 ( 2 ชั่วโมง)