ตัวแปรเครื่องมือ: คำจำกัดความและตัวอย่าง


บ่อยครั้งในสถิติ เราพยายามที่จะประมาณผลกระทบของตัวแปรหนึ่งต่ออีกตัวแปรหนึ่ง ตัวอย่างเช่น เราอาจต้องการทราบ:

  • เวลาที่ใช้ในการเรียนส่งผลต่อคะแนนสอบอย่างไร?
  • ยาบางชนิดส่งผลต่อความดันโลหิตอย่างไร?
  • ความเครียดส่งผลต่ออัตราการเต้นของหัวใจอย่างไร?

ในแต่ละสถานการณ์ เราต้องการทำความเข้าใจว่าตัวแปรทำนายส่งผลต่อ ตัวแปรตอบสนอง หรือไม่ อย่างไรก็ตาม มักจะมีตัวแปรอื่นๆ ที่ส่งผลต่อความสัมพันธ์ระหว่างตัวแปรทั้งสอง

ตัวอย่างเช่น สมมติว่าเราใช้ยาบางชนิดเป็นตัวแปรทำนาย และความดันโลหิตเป็นตัวแปรตอบสนอง เราสนใจเฉพาะผลของยาต่อความดันโลหิตเท่านั้น:

อย่างไรก็ตาม ตัวแปรอื่นๆ เช่น เวลาที่ใช้ออกกำลังกาย อาหารทั่วไป และระดับความเครียดก็ส่งผลต่อความดันโลหิตเช่นกัน:

ดังนั้น หากเราทำการ ถดถอยเชิงเส้นอย่างง่าย โดยใช้ยาเป็นตัวแปรทำนาย และใช้ความดันโลหิตเป็นตัวแปรตอบสนอง เราไม่สามารถแน่ใจได้ว่า สัมประสิทธิ์การถดถอย จะจับผลกระทบของยาต่อความดันโลหิตได้อย่างแม่นยำ เนื่องจากปัจจัยภายนอก (การออกกำลังกาย อาหาร ความเครียด ฯลฯ) ก็อาจมีบทบาทได้เช่นกัน

วิธีหนึ่งที่เป็นไปได้ในการแก้ไขปัญหานี้คือการใช้ ตัวแปรเครื่องมือ

ตัวแปรเครื่องมือคืออะไร?

ตัวแปรเครื่องมือ คือตัวแปรตัวที่สามที่ใช้ในการวิเคราะห์การถดถอยซึ่งมีความสัมพันธ์กับตัวแปรทำนาย แต่ไม่สัมพันธ์กับตัวแปรตอบสนอง การใช้ตัวแปรนี้ทำให้สามารถประมาณผลเชิงสาเหตุที่แท้จริงที่ตัวแปรทำนายมีต่อตัวแปรตอบสนองได้

ตัวอย่างเช่น สมมติว่าเราต้องการประมาณผลของยาบางชนิดต่อความดันโลหิต:

ตัวอย่างของตัวแปรเครื่องมือที่เราสามารถใช้ในการวิเคราะห์การถดถอยนี้คือความใกล้ชิดของแต่ละบุคคลกับร้านขายยา

ตัวแปร “ความใกล้เคียง” นี้น่าจะมีความสัมพันธ์อย่างมากกับการที่แต่ละบุคคลใช้ยาดังกล่าวหรือไม่ เนื่องจากบุคคลจะไม่สามารถรับยาได้ตั้งแต่แรกหากพวกเขาไม่ได้อาศัยอยู่ใกล้ร้านขายยา

อย่างไรก็ตาม ตัวแปร “ความใกล้เคียง” ไม่ควรมีความสัมพันธ์ใดๆ กับความดันโลหิต การเชื่อมโยงเพียงอย่างเดียวที่จะมีกับความดันโลหิตคือผ่านทางตัวแปรทำนาย

เครื่องดนตรีที่แปรผันได้

วิธีที่เราใช้ตัวแปรเครื่องมือจริงๆ คือการถดถอยของตัวแปรเครื่องมือ ซึ่งบางครั้งเรียกว่า การถดถอยกำลังสองน้อยที่สุดแบบสองขั้นตอน

การถดถอยของตัวแปรเครื่องมือ

การถดถอยของตัวแปรเครื่องมือ (หรือการถดถอยกำลังสองน้อยที่สุดแบบสองขั้นตอน) ใช้วิธีการต่อไปนี้เพื่อประมาณผลกระทบของตัวแปรทำนายต่อตัวแปรตอบสนอง:

ขั้นตอนที่ 1: ปรับโมเดลการถดถอยโดยใช้ตัวแปรเครื่องมือเป็นตัวแปรทำนาย

ในตัวอย่างเฉพาะของเรา เราจะปรับโมเดลการถดถอยต่อไปนี้ให้เหมาะสมก่อน:

ยาบางชนิด = B 0 + B 1 (ใกล้เคียง)

จากนั้นเราจะเหลือค่าที่ทำนายไว้สำหรับยาบางชนิด (cd) ซึ่งเราจะเรียกว่า หมวก ซีดี .

ขั้นตอนที่ 2: ติดตั้งโมเดลการถดถอยที่สองโดยใช้ค่าที่คาดการณ์ไว้สำหรับ cd hat

ต่อไป เราจะใส่โมเดลการถดถอยต่อไปนี้:

ความดันโลหิต = B 0 + B 1 ( หมวก ซีดี)

หากพบว่าค่าสัมประสิทธิ์การถดถอยของซีดี แฮ็ท มีนัยสำคัญทางสถิติ เราก็อาจกล่าวได้ว่ายานี้มีผลกระทบเชิงสาเหตุต่อความดันโลหิต

เหตุผลที่เราสามารถพูดได้ก็เนื่องมาจากเราใช้คำว่า “ความใกล้ชิด” เพื่อสร้าง CD Hat เท่านั้น และเรารู้ว่าความใกล้ชิดไม่ควรสัมพันธ์กับความดันโลหิต ความสัมพันธ์ที่มีนัยสำคัญใดๆ ในการถดถอยระยะที่สองอาจเกิดจากยาบางชนิด

ข้อควรระวังเกี่ยวกับการใช้ตัวแปรเครื่องมือ

ควรใช้ตัวแปรเครื่องมือหากตรงตามเกณฑ์ต่อไปนี้เท่านั้น

  • มันมีความสัมพันธ์อย่างมากกับตัวแปรทำนาย
  • มันไม่สัมพันธ์กับตัวแปรตอบสนอง
  • ไม่มีความสัมพันธ์กับตัวแปรอื่นๆ ที่ไม่รวมอยู่ในแบบจำลอง (เช่น ความใกล้ชิดไม่มีความสัมพันธ์กับการออกกำลังกาย อาหาร หรือความเครียด)

หากตัวแปรเครื่องมือไม่ตรงตามเกณฑ์นี้ ก็ไม่ควรใช้ตัวแปรนั้นในแบบจำลองการถดถอย เนื่องจากมีแนวโน้มที่จะให้ผลลัพธ์ที่ไม่น่าเชื่อถือและเอนเอียง

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *