ตัวแปรเครื่องมือ: คำจำกัดความและตัวอย่าง
บ่อยครั้งในสถิติ เราพยายามที่จะประมาณผลกระทบของตัวแปรหนึ่งต่ออีกตัวแปรหนึ่ง ตัวอย่างเช่น เราอาจต้องการทราบ:
- เวลาที่ใช้ในการเรียนส่งผลต่อคะแนนสอบอย่างไร?
- ยาบางชนิดส่งผลต่อความดันโลหิตอย่างไร?
- ความเครียดส่งผลต่ออัตราการเต้นของหัวใจอย่างไร?
ในแต่ละสถานการณ์ เราต้องการทำความเข้าใจว่าตัวแปรทำนายส่งผลต่อ ตัวแปรตอบสนอง หรือไม่ อย่างไรก็ตาม มักจะมีตัวแปรอื่นๆ ที่ส่งผลต่อความสัมพันธ์ระหว่างตัวแปรทั้งสอง
ตัวอย่างเช่น สมมติว่าเราใช้ยาบางชนิดเป็นตัวแปรทำนาย และความดันโลหิตเป็นตัวแปรตอบสนอง เราสนใจเฉพาะผลของยาต่อความดันโลหิตเท่านั้น:
อย่างไรก็ตาม ตัวแปรอื่นๆ เช่น เวลาที่ใช้ออกกำลังกาย อาหารทั่วไป และระดับความเครียดก็ส่งผลต่อความดันโลหิตเช่นกัน:
ดังนั้น หากเราทำการ ถดถอยเชิงเส้นอย่างง่าย โดยใช้ยาเป็นตัวแปรทำนาย และใช้ความดันโลหิตเป็นตัวแปรตอบสนอง เราไม่สามารถแน่ใจได้ว่า สัมประสิทธิ์การถดถอย จะจับผลกระทบของยาต่อความดันโลหิตได้อย่างแม่นยำ เนื่องจากปัจจัยภายนอก (การออกกำลังกาย อาหาร ความเครียด ฯลฯ) ก็อาจมีบทบาทได้เช่นกัน
วิธีหนึ่งที่เป็นไปได้ในการแก้ไขปัญหานี้คือการใช้ ตัวแปรเครื่องมือ
ตัวแปรเครื่องมือคืออะไร?
ตัวแปรเครื่องมือ คือตัวแปรตัวที่สามที่ใช้ในการวิเคราะห์การถดถอยซึ่งมีความสัมพันธ์กับตัวแปรทำนาย แต่ไม่สัมพันธ์กับตัวแปรตอบสนอง การใช้ตัวแปรนี้ทำให้สามารถประมาณผลเชิงสาเหตุที่แท้จริงที่ตัวแปรทำนายมีต่อตัวแปรตอบสนองได้
ตัวอย่างเช่น สมมติว่าเราต้องการประมาณผลของยาบางชนิดต่อความดันโลหิต:
ตัวอย่างของตัวแปรเครื่องมือที่เราสามารถใช้ในการวิเคราะห์การถดถอยนี้คือความใกล้ชิดของแต่ละบุคคลกับร้านขายยา
ตัวแปร “ความใกล้เคียง” นี้น่าจะมีความสัมพันธ์อย่างมากกับการที่แต่ละบุคคลใช้ยาดังกล่าวหรือไม่ เนื่องจากบุคคลจะไม่สามารถรับยาได้ตั้งแต่แรกหากพวกเขาไม่ได้อาศัยอยู่ใกล้ร้านขายยา
อย่างไรก็ตาม ตัวแปร “ความใกล้เคียง” ไม่ควรมีความสัมพันธ์ใดๆ กับความดันโลหิต การเชื่อมโยงเพียงอย่างเดียวที่จะมีกับความดันโลหิตคือผ่านทางตัวแปรทำนาย
วิธีที่เราใช้ตัวแปรเครื่องมือจริงๆ คือการถดถอยของตัวแปรเครื่องมือ ซึ่งบางครั้งเรียกว่า การถดถอยกำลังสองน้อยที่สุดแบบสองขั้นตอน
การถดถอยของตัวแปรเครื่องมือ
การถดถอยของตัวแปรเครื่องมือ (หรือการถดถอยกำลังสองน้อยที่สุดแบบสองขั้นตอน) ใช้วิธีการต่อไปนี้เพื่อประมาณผลกระทบของตัวแปรทำนายต่อตัวแปรตอบสนอง:
ขั้นตอนที่ 1: ปรับโมเดลการถดถอยโดยใช้ตัวแปรเครื่องมือเป็นตัวแปรทำนาย
ในตัวอย่างเฉพาะของเรา เราจะปรับโมเดลการถดถอยต่อไปนี้ให้เหมาะสมก่อน:
ยาบางชนิด = B 0 + B 1 (ใกล้เคียง)
จากนั้นเราจะเหลือค่าที่ทำนายไว้สำหรับยาบางชนิด (cd) ซึ่งเราจะเรียกว่า หมวก ซีดี .
ขั้นตอนที่ 2: ติดตั้งโมเดลการถดถอยที่สองโดยใช้ค่าที่คาดการณ์ไว้สำหรับ cd hat
ต่อไป เราจะใส่โมเดลการถดถอยต่อไปนี้:
ความดันโลหิต = B 0 + B 1 ( หมวก ซีดี)
หากพบว่าค่าสัมประสิทธิ์การถดถอยของซีดี แฮ็ท มีนัยสำคัญทางสถิติ เราก็อาจกล่าวได้ว่ายานี้มีผลกระทบเชิงสาเหตุต่อความดันโลหิต
เหตุผลที่เราสามารถพูดได้ก็เนื่องมาจากเราใช้คำว่า “ความใกล้ชิด” เพื่อสร้าง CD Hat เท่านั้น และเรารู้ว่าความใกล้ชิดไม่ควรสัมพันธ์กับความดันโลหิต ความสัมพันธ์ที่มีนัยสำคัญใดๆ ในการถดถอยระยะที่สองอาจเกิดจากยาบางชนิด
ข้อควรระวังเกี่ยวกับการใช้ตัวแปรเครื่องมือ
ควรใช้ตัวแปรเครื่องมือหากตรงตามเกณฑ์ต่อไปนี้เท่านั้น
- มันมีความสัมพันธ์อย่างมากกับตัวแปรทำนาย
- มันไม่สัมพันธ์กับตัวแปรตอบสนอง
- ไม่มีความสัมพันธ์กับตัวแปรอื่นๆ ที่ไม่รวมอยู่ในแบบจำลอง (เช่น ความใกล้ชิดไม่มีความสัมพันธ์กับการออกกำลังกาย อาหาร หรือความเครียด)
หากตัวแปรเครื่องมือไม่ตรงตามเกณฑ์นี้ ก็ไม่ควรใช้ตัวแปรนั้นในแบบจำลองการถดถอย เนื่องจากมีแนวโน้มที่จะให้ผลลัพธ์ที่ไม่น่าเชื่อถือและเอนเอียง