วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน stata
การถดถอยเชิงเส้นพหุคูณ เป็นวิธีที่คุณสามารถใช้เพื่อทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรอธิบายหลายตัวกับตัวแปรตอบสนอง
บทช่วยสอนนี้จะอธิบายวิธีการถดถอยเชิงเส้นพหุคูณใน Stata
ตัวอย่าง: การถดถอยเชิงเส้นพหุคูณใน Stata
สมมติว่าเราต้องการทราบว่าไมล์ต่อแกลลอนและน้ำหนักส่งผลต่อราคารถยนต์หรือไม่ เพื่อทดสอบสิ่งนี้ เราสามารถทำการถดถอยเชิงเส้นพหุคูณโดยใช้ไมล์ต่อแกลลอนและน้ำหนักเป็นตัวแปรอธิบายสองตัว และราคาเป็นตัวแปรตอบสนอง
ทำตามขั้นตอนต่อไปนี้ใน Stata เพื่อทำการถดถอยเชิงเส้นหลายรายการโดยใช้ชุดข้อมูลที่เรียกว่า auto ซึ่งมีข้อมูลของรถยนต์ 74 คันที่แตกต่างกัน
ขั้นตอนที่ 1: โหลดข้อมูล
โหลดข้อมูลโดยพิมพ์ข้อความต่อไปนี้ในกล่องคำสั่ง:
ใช้ https://www.stata-press.com/data/r13/auto
ขั้นตอนที่ 2: รับข้อมูลสรุป
ทำความเข้าใจข้อมูลที่คุณกำลังทำงานอย่างรวดเร็วโดยพิมพ์ข้อความต่อไปนี้ในกล่องคำสั่ง:
เพื่อสรุป
เราจะเห็นว่าชุดข้อมูลมีตัวแปรที่แตกต่างกัน 12 ตัว แต่ตัวแปรเดียวที่เราสนใจคือ mpg น้ำหนัก และ price
เราสามารถดูสถิติสรุปพื้นฐานต่อไปนี้เกี่ยวกับตัวแปรทั้งสามนี้:
ราคา | เฉลี่ย = $6,165 ขั้นต่ำ = $3,291 สูงสุด $15,906
mpg | ค่าเฉลี่ย = 21.29, ต่ำสุด = 12, สูงสุด = 41
น้ำหนัก | เฉลี่ย = 3,019 ปอนด์ ต่ำสุด = 1,760 ปอนด์ สูงสุด = 4,840 ปอนด์
ขั้นตอนที่ 3: ดำเนินการถดถอยเชิงเส้นหลายรายการ
พิมพ์ข้อความต่อไปนี้ในกล่องคำสั่งเพื่อดำเนินการถดถอยเชิงเส้นพหุคูณโดยใช้ mpg และน้ำหนักเป็นตัวแปรอธิบาย และราคาเป็นตัวแปรตอบสนอง
ราคาถดถอย mpg น้ำหนัก
วิธีการตีความตัวเลขที่น่าสนใจที่สุดในผลลัพธ์มีดังนี้:
ปัญหา> F: 0.000 นี่คือค่า p สำหรับการถดถอยโดยรวม เนื่องจากค่านี้น้อยกว่า 0.05 จึงบ่งชี้ว่าตัวแปรอธิบายที่รวมกันของ mpg และ น้ำหนัก มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับ ราคา ตัวแปรตอบสนอง
R กำลังสอง: 0.2934 นี่คือสัดส่วนของความแปรปรวนในตัวแปรตอบสนองที่สามารถอธิบายได้ด้วยตัวแปรอธิบาย ในตัวอย่างนี้ 29.34% ของการเปลี่ยนแปลงราคาสามารถอธิบายได้ด้วย mpg และน้ำหนัก
โคอีฟ (mpg): -49.512. ข้อมูลนี้บอกเราถึงการเปลี่ยนแปลงโดยเฉลี่ยของราคาที่เกี่ยวข้องกับการเพิ่มขึ้นของ MPG หนึ่งหน่วย โดยสมมติว่าน้ำหนักคงที่ ในตัวอย่างนี้ การเพิ่มขึ้นของ MPG หนึ่งหน่วยแต่ละครั้งสัมพันธ์กับการลดราคาเฉลี่ยประมาณ 49.51 ดอลลาร์สหรัฐฯ โดยสมมติว่าน้ำหนักคงที่
ตัวอย่างเช่น สมมติว่ารถยนต์ A และ B หนักทั้งคู่ 2,000 ปอนด์ หากรถ A ได้ 20 mpg และรถ B ได้เพียง 19 mpg เราคาดว่าราคาของรถ A จะต่ำกว่าราคาของรถ B ถึง 49.51 ดอลลาร์
ป>|t| (mpg): 0.567. นี่คือค่า p ที่เกี่ยวข้องกับสถิติการทดสอบสำหรับ mpg เนื่องจากค่านี้ไม่น้อยกว่า 0.05 เราจึงไม่มีหลักฐานว่า mpg มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับราคา
ค่าโคฟ(น้ำหนัก) : 1,746. ข้อมูลนี้บอกเราถึงการเปลี่ยนแปลงโดยเฉลี่ยของราคาที่เกี่ยวข้องกับน้ำหนักที่เพิ่มขึ้นหนึ่งหน่วย โดยสมมติว่า mpg ยังคงคงที่ ในตัวอย่างนี้ น้ำหนักที่เพิ่มขึ้นแต่ละหน่วยสัมพันธ์กับราคาที่เพิ่มขึ้นโดยเฉลี่ยประมาณ 1.74 ดอลลาร์ โดยสมมติว่า MPG ยังคงคงที่
ตัวอย่างเช่น สมมติว่ารถยนต์ A และ B ต่างก็มีความเร็ว 20 ไมล์ต่อแกลลอน หากรถ A หนักกว่ารถ B หนึ่งปอนด์ รถ A ควรมีราคาสูงกว่า 1.74 ดอลลาร์
ป>|t| (น้ำหนัก): 0.008. นี่คือค่า p ที่เกี่ยวข้องกับสถิติการทดสอบน้ำหนัก เนื่องจากค่านี้น้อยกว่า 0.05 เราจึงมีหลักฐานเพียงพอที่จะบอกว่าน้ำหนักมีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับราคา
โคฟ (_cons): 1946.069. สิ่งนี้บอกเราถึงราคาเฉลี่ยของรถยนต์เมื่อ mpg และน้ำหนักเป็นศูนย์ ในตัวอย่างนี้ ราคาเฉลี่ยอยู่ที่ 1,946 เหรียญสหรัฐฯ เมื่อน้ำหนักและ MPG เป็นศูนย์ สิ่งนี้ไม่สมเหตุสมผลเลยที่จะตีความเนื่องจากน้ำหนักของรถและ mpg ไม่สามารถเป็นศูนย์ได้ แต่ต้องใช้หมายเลข 1946.069 เพื่อสร้างสมการถดถอย
ขั้นตอนที่ 4: รายงานผลลัพธ์
สุดท้ายนี้ เราต้องการรายงานผลลัพธ์ของการถดถอยเชิงเส้นพหุคูณของเรา นี่คือตัวอย่างของวิธีการทำเช่นนี้:
ดำเนินการถดถอยเชิงเส้นพหุคูณเพื่อหาปริมาณความสัมพันธ์ระหว่างน้ำหนักรถยนต์กับ MPG และราคา ใช้ตัวอย่างรถยนต์จำนวน 74 คันในการวิเคราะห์
ผลการวิจัยพบว่ามีความสัมพันธ์ระหว่างน้ำหนักและราคาอย่างมีนัยสำคัญทางสถิติ (t = 2.72, p = 0.008) แต่ไม่มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่าง mpg และราคา (และ mpg (t = -0.57, p = 0.567)