โควาเรียตในสถิติคืออะไร?
ในทางสถิติ นักวิจัยมักต้องการเข้าใจความสัมพันธ์ระหว่าง ตัวแปรอธิบายตั้งแต่หนึ่งตัวแปร ขึ้นไปกับ ตัวแปรตอบสนอง
อย่างไรก็ตาม อาจเป็นกรณีที่ตัวแปรอื่นอาจส่งผลต่อตัวแปรตอบสนองและไม่เป็นที่สนใจของนักวิจัย ตัวแปรเหล่านี้เรียกว่า ตัวแปรร่วม
Covariates: ตัวแปรที่ส่งผลต่อตัวแปรตอบสนอง แต่ไม่สนใจในการศึกษา
ตัวอย่างเช่น สมมติว่านักวิจัยต้องการทราบว่าเทคนิคการศึกษาที่แตกต่างกันสามเทคนิคนำไปสู่คะแนนสอบเฉลี่ยที่แตกต่างกันในโรงเรียนที่กำหนดหรือไม่ เทคนิคการเรียนเป็นตัวแปรอธิบายและคะแนนสอบเป็นตัวแปรตอบสนอง
อย่างไรก็ตาม ความสามารถในการเรียนของนักเรียนทั้ง 3 กลุ่มมีความแตกต่างกันอย่างแน่นอน หากไม่คำนึงถึงสิ่งนี้ จะทำให้เกิดการเปลี่ยนแปลงที่ไม่สามารถอธิบายได้ภายในการศึกษา และจะทำให้ยากขึ้นในการระบุความสัมพันธ์ที่แท้จริงระหว่างเทคนิคการศึกษากับผลการสอบ
วิธีหนึ่งในการพิจารณาเรื่องนี้คือใช้เกรดปัจจุบันของนักเรียนในชั้นเรียนเป็น ตัวแปรร่วม เป็นที่ทราบกันดีว่าเกรดปัจจุบันของนักเรียนมีแนวโน้มที่จะสัมพันธ์กับผลการสอบในอนาคต
ดังนั้น แม้ว่าเกรดปัจจุบันจะไม่ใช่ตัวแปรที่น่าสนใจในการศึกษานี้ แต่ก็สามารถรวมเป็นตัวแปรร่วมได้เพื่อให้นักวิจัยสามารถดูว่าเทคนิคการศึกษาส่งผลต่อคะแนนสอบหรือไม่ แม้ว่าจะพิจารณาเกรดปัจจุบันของนักเรียนในชั้นเรียนแล้วก็ตาม
โควาเรียตปรากฏบ่อยที่สุดในบริบทสองประเภท: ANOVA (การวิเคราะห์ความแปรปรวน) และการถดถอย
โควาเรียตใน ANOVA
เมื่อเราดำเนินการวิเคราะห์ความแปรปรวน (ไม่ว่าจะเป็นการ วิเคราะห์ความแปรปรวนแบบทางเดียว การวิเคราะห์ความแปรปรวนแบบสองทาง หรืออะไรที่ซับซ้อนกว่านั้น) เราต้องการทราบว่ามีความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มอิสระสามกลุ่มขึ้นไปหรือไม่
ในตัวอย่างก่อนหน้านี้ เราต้องการทำความเข้าใจว่าคะแนนสอบเฉลี่ยระหว่างเทคนิคการเรียนสามแบบที่แตกต่างกันแตกต่างกันหรือไม่ เพื่อให้เข้าใจสิ่งนี้ เราอาจทำการวิเคราะห์ความแปรปรวนแบบทางเดียวได้
อย่างไรก็ตาม เนื่องจากเรารู้ว่าเกรดปัจจุบันของนักเรียนมีแนวโน้มที่จะส่งผลต่อคะแนนการสอบด้วย เราจึงสามารถรวมเกรดนั้นเป็นตัวแปรร่วมและดำเนินการ ANCOVA (การวิเคราะห์ความแปรปรวนร่วม) แทน
ซึ่งคล้ายกับ ANOVA ยกเว้นว่าเรารวมตัวแปรต่อเนื่อง (เกรดปัจจุบันของนักเรียน) ไว้เป็น ตัวแปรร่วม เพื่อให้เราเข้าใจได้ว่าคะแนนสอบเฉลี่ยแตกต่างกันระหว่างเทคนิคการให้คะแนนทั้งสามแบบหรือไม่ การศึกษา แม้จะคำนึงถึงผลงานของนักเรียนแล้วก็ตาม เรตติ้งปัจจุบัน
โควาเรียตในการถดถอย
เมื่อเราทำการถดถอยเชิงเส้น เราต้องการหาปริมาณความสัมพันธ์ระหว่างตัวแปรอธิบายตั้งแต่หนึ่งตัวขึ้นไปกับตัวแปรตอบสนอง
ตัวอย่างเช่น เราสามารถทำการ ถดถอยเชิงเส้นอย่างง่าย เพื่อหาปริมาณความสัมพันธ์ระหว่างพื้นที่เป็นตารางฟุตและราคาอสังหาริมทรัพย์ในเมืองหนึ่งๆ อย่างไรก็ตามเป็นที่รู้กันว่าอายุของบ้านก็เป็นตัวแปรที่ส่งผลต่อราคาอสังหาริมทรัพย์เช่นกัน
โดยเฉพาะอย่างยิ่งบ้านที่มีอายุมากกว่าอาจมีความสัมพันธ์กับราคาทรัพย์สินที่ลดลง ในกรณีนี้ อายุของบ้านจะเป็น ตัวแปรร่วม เนื่องจากเราไม่ได้สนใจที่จะศึกษามันจริงๆ แต่เรารู้ว่ามันมีผลกระทบต่อราคาบ้าน
ดังนั้นเราจึงสามารถรวมอายุของบ้านเป็นตัวแปรอธิบาย และใช้การถดถอยเชิงเส้นพหุคูณด้วยพื้นที่เป็นตารางฟุตและอายุของบ้านเป็นตัวแปรอธิบาย และราคาบ้านเป็นตัวแปรตอบสนอง
ดังนั้น ค่าสัมประสิทธิ์การถดถอย สำหรับพื้นที่เป็นตารางฟุตจะบอกเราถึงการเปลี่ยนแปลงโดยเฉลี่ยของราคาบ้านที่เกี่ยวข้องกับการเพิ่มขึ้นของพื้นที่เป็นตารางฟุตหนึ่งหน่วย หลังจากพิจารณาอายุของบ้านแล้ว
แหล่งข้อมูลเพิ่มเติม
ข้อมูลเบื้องต้นเกี่ยวกับ ANCOVA (การวิเคราะห์ความแปรปรวน)
วิธีการตีความค่าสัมประสิทธิ์การถดถอย
วิธีดำเนินการ ANCOVA ใน Excel
วิธีการดำเนินการถดถอยเชิงเส้นหลายรายการใน Excel