วิธีสร้างตัวแปรจำลองใน excel (ทีละขั้นตอน)


ตัวแปรจำลอง คือตัวแปรประเภทหนึ่งที่เราสร้างขึ้นในการวิเคราะห์การถดถอย เพื่อให้เราสามารถแสดงตัวแปรหมวดหมู่เป็นตัวแปรตัวเลขที่รับค่าหนึ่งในสองค่า: ศูนย์หรือหนึ่งค่า

ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้และต้องการใช้ อายุ และ สถานภาพสมรส ในการทำนาย รายได้ :

หากต้องการใช้ สถานภาพการสมรส เป็นตัวแปรทำนายในแบบจำลองการถดถอย เราจำเป็นต้องแปลงให้เป็นตัวแปรจำลอง

เนื่องจากปัจจุบันนี้เป็นตัวแปรเด็ดขาดที่สามารถรับค่าที่แตกต่างกันได้สามค่า (“โสด”, “แต่งงานแล้ว” หรือ “หย่าร้าง”) เราจึงต้องสร้างตัวแปรจำลอง k -1 = 3-1 = 2 ตัว

ในการสร้างตัวแปรจำลองนี้ เราสามารถปล่อยให้ “เดี่ยว” เป็นค่าฐานได้เนื่องจากปรากฏบ่อยที่สุด ต่อไปนี้คือวิธีที่เราจะแปลง สถานภาพการสมรส เป็นตัวแปรจำลอง:

บทช่วยสอนนี้ให้ตัวอย่างทีละขั้นตอนของวิธีสร้างตัวแปรจำลองสำหรับชุดข้อมูลที่แน่นอนนี้ใน Excel จากนั้นทำการวิเคราะห์การถดถอยโดยใช้ตัวแปรจำลองเหล่านี้เป็นตัวทำนาย

ขั้นตอนที่ 1: สร้างข้อมูล

ขั้นแรก มาสร้างชุดข้อมูลใน Excel กัน:

ขั้นตอนที่ 2: สร้างตัวแปรจำลอง

ต่อไป เราสามารถคัดลอกค่าจากคอลัมน์ A และ B ลงในคอลัมน์ E และ F จากนั้นใช้ฟังก์ชัน IF() ใน Excel เพื่อกำหนดตัวแปรจำลองใหม่สองตัว: แต่งงานแล้ว และ หย่าร้าง

ตัวแปรจำลองใน Excel

นี่คือสูตรที่เราใช้ในเซลล์ G2 ซึ่งเราคัดลอกไปยังเซลล์ที่เหลือในคอลัมน์ G:

 = IF (C2 = "Married", 1, 0)

และนี่คือสูตรที่เราใช้ในเซลล์ H2 ซึ่งเราคัดลอกไปยังเซลล์ที่เหลือในคอลัมน์ H:

 = IF (C2 = "Divorced", 1, 0)

จากนั้นเราสามารถใช้ตัวแปรจำลองเหล่านี้ในแบบจำลองการถดถอยเพื่อทำนายรายได้

ขั้นตอนที่ 3: ดำเนินการการถดถอยเชิงเส้น

หากต้องการทำการถดถอยเชิงเส้นหลายรายการ เราต้องคลิกที่แท็บ ข้อมูล บริเวณริบบิ้นด้านบน จากนั้น คลิกการวิเคราะห์ข้อมูล ในส่วน การวิเคราะห์ :

หากไม่มีตัวเลือกนี้ คุณต้องโหลด Analysis Toolpak ก่อน

ในหน้าต่างที่ปรากฏขึ้น คลิก Regression จากนั้นคลิก OK

จากนั้นกรอกข้อมูลต่อไปนี้แล้วคลิก ตกลง

ตัวแปรจำลองการถดถอยใน Excel

สิ่งนี้ให้ผลลัพธ์ดังต่อไปนี้:

การถดถอยด้วยตัวแปรจำลองใน Excel

จากผลลัพธ์ เราจะเห็นได้ว่าเส้นถดถอยที่พอดีคือ:

รายได้ = 14,276.12 + 1,471.67*(อายุ) + 2,479.75*(แต่งงานแล้ว) – 8,397.40*(หย่าร้าง)

เราสามารถใช้สมการนี้เพื่อค้นหารายได้โดยประมาณของแต่ละบุคคลโดยพิจารณาจากอายุและสถานภาพการสมรส ตัวอย่างเช่น บุคคลที่อายุ 35 ปีและแต่งงานแล้วจะมีรายได้ประมาณ $68,264 :

รายได้ = 14,276.12 + 1,471.67*(35) + 2,479.75*(1) – 8,397.40*(0) = 68,264 ดอลลาร์

ต่อไปนี้เป็นวิธีการตีความค่าสัมประสิทธิ์การถดถอยในตาราง:

  • การสกัดกั้น: การสกัดกั้นแสดงถึงรายได้เฉลี่ยของบุคคลคนเดียวที่มีอายุเป็นศูนย์ เนื่องจากบุคคลหนึ่งๆ ไม่สามารถมีอายุเป็น 0 ปีได้ จึงไม่สมเหตุสมผลที่จะตีความการสกัดกั้นด้วยตัวมันเองในแบบจำลองการถดถอยโดยเฉพาะนี้
  • อายุ: อายุที่เพิ่มขึ้นในแต่ละปีสัมพันธ์กับรายได้ที่เพิ่มขึ้นโดยเฉลี่ย 1,471.67 ดอลลาร์ เนื่องจากค่า p (0.004) น้อยกว่า 0.05 อายุจึงเป็นตัวทำนายรายได้ที่มีนัยสำคัญทางสถิติ
  • แต่งงานแล้ว: คนที่แต่งงานแล้วมีรายได้เฉลี่ยมากกว่า 2,479.75 ดอลลาร์สหรัฐฯ มากกว่าคนเดียว เนื่องจากค่า p (0.800) ไม่น้อยกว่า 0.05 ความแตกต่างนี้จึงไม่มีนัยสำคัญทางสถิติ
  • หย่าร้าง: บุคคลที่หย่าร้างมีรายได้โดยเฉลี่ย 8,397.40 ดอลลาร์น้อยกว่าบุคคลเดียว เนื่องจากค่า p (0.532) ไม่น้อยกว่า 0.05 ความแตกต่างนี้จึงไม่มีนัยสำคัญทางสถิติ

เนื่องจากตัวแปรจำลองทั้งสองไม่มีนัยสำคัญทางสถิติ เราจึงสามารถลบ สถานภาพการสมรส ซึ่งเป็นตัวทำนายออกจากแบบจำลองได้ เนื่องจากดูเหมือนว่าจะไม่เพิ่มมูลค่าเชิงทำนายให้กับรายได้

แหล่งข้อมูลเพิ่มเติม

วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน Excel
วิธีการคำนวณผลรวมที่เหลือของกำลังสองใน Excel
วิธีการดำเนินการถดถอยพหุนามใน Excel
วิธีการสร้างพล็อตที่เหลือใน Excel

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *