โควาเรียตในสถิติคืออะไร?


ในทางสถิติ นักวิจัยมักต้องการเข้าใจความสัมพันธ์ระหว่าง ตัวแปรอธิบายตั้งแต่หนึ่งตัวแปร ขึ้นไปกับ ตัวแปรตอบสนอง

อย่างไรก็ตาม อาจเป็นกรณีที่ตัวแปรอื่นอาจส่งผลต่อตัวแปรตอบสนองและไม่เป็นที่สนใจของนักวิจัย ตัวแปรเหล่านี้เรียกว่า ตัวแปรร่วม

Covariates: ตัวแปรที่ส่งผลต่อตัวแปรตอบสนอง แต่ไม่สนใจในการศึกษา

คำจำกัดความของความแปรปรวนร่วมในสถิติ

ตัวอย่างเช่น สมมติว่านักวิจัยต้องการทราบว่าเทคนิคการศึกษาที่แตกต่างกันสามเทคนิคนำไปสู่คะแนนสอบเฉลี่ยที่แตกต่างกันในโรงเรียนที่กำหนดหรือไม่ เทคนิคการเรียนเป็นตัวแปรอธิบายและคะแนนสอบเป็นตัวแปรตอบสนอง

อย่างไรก็ตาม ความสามารถในการเรียนของนักเรียนทั้ง 3 กลุ่มมีความแตกต่างกันอย่างแน่นอน หากไม่คำนึงถึงสิ่งนี้ จะทำให้เกิดการเปลี่ยนแปลงที่ไม่สามารถอธิบายได้ภายในการศึกษา และจะทำให้ยากขึ้นในการระบุความสัมพันธ์ที่แท้จริงระหว่างเทคนิคการศึกษากับผลการสอบ

วิธีหนึ่งในการพิจารณาเรื่องนี้คือใช้เกรดปัจจุบันของนักเรียนในชั้นเรียนเป็น ตัวแปรร่วม เป็นที่ทราบกันดีว่าเกรดปัจจุบันของนักเรียนมีแนวโน้มที่จะสัมพันธ์กับผลการสอบในอนาคต

ตัวอย่างโควาเรียตในสถิติ

ดังนั้น แม้ว่าเกรดปัจจุบันจะไม่ใช่ตัวแปรที่น่าสนใจในการศึกษานี้ แต่ก็สามารถรวมเป็นตัวแปรร่วมได้เพื่อให้นักวิจัยสามารถดูว่าเทคนิคการศึกษาส่งผลต่อคะแนนสอบหรือไม่ แม้ว่าจะพิจารณาเกรดปัจจุบันของนักเรียนในชั้นเรียนแล้วก็ตาม

โควาเรียตปรากฏบ่อยที่สุดในบริบทสองประเภท: ANOVA (การวิเคราะห์ความแปรปรวน) และการถดถอย

โควาเรียตใน ANOVA

เมื่อเราดำเนินการวิเคราะห์ความแปรปรวน (ไม่ว่าจะเป็นการ วิเคราะห์ความแปรปรวนแบบทางเดียว การวิเคราะห์ความแปรปรวนแบบสองทาง หรืออะไรที่ซับซ้อนกว่านั้น) เราต้องการทราบว่ามีความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มอิสระสามกลุ่มขึ้นไปหรือไม่

ในตัวอย่างก่อนหน้านี้ เราต้องการทำความเข้าใจว่าคะแนนสอบเฉลี่ยระหว่างเทคนิคการเรียนสามแบบที่แตกต่างกันแตกต่างกันหรือไม่ เพื่อให้เข้าใจสิ่งนี้ เราอาจทำการวิเคราะห์ความแปรปรวนแบบทางเดียวได้

อย่างไรก็ตาม เนื่องจากเรารู้ว่าเกรดปัจจุบันของนักเรียนมีแนวโน้มที่จะส่งผลต่อคะแนนการสอบด้วย เราจึงสามารถรวมเกรดนั้นเป็นตัวแปรร่วมและดำเนินการ ANCOVA (การวิเคราะห์ความแปรปรวนร่วม) แทน

ซึ่งคล้ายกับ ANOVA ยกเว้นว่าเรารวมตัวแปรต่อเนื่อง (เกรดปัจจุบันของนักเรียน) ไว้เป็น ตัวแปรร่วม เพื่อให้เราเข้าใจได้ว่าคะแนนสอบเฉลี่ยแตกต่างกันระหว่างเทคนิคการให้คะแนนทั้งสามแบบหรือไม่ การศึกษา แม้จะคำนึงถึงผลงานของนักเรียนแล้วก็ตาม เรตติ้งปัจจุบัน

โควาเรียตในการถดถอย

เมื่อเราทำการถดถอยเชิงเส้น เราต้องการหาปริมาณความสัมพันธ์ระหว่างตัวแปรอธิบายตั้งแต่หนึ่งตัวขึ้นไปกับตัวแปรตอบสนอง

ตัวอย่างเช่น เราสามารถทำการ ถดถอยเชิงเส้นอย่างง่าย เพื่อหาปริมาณความสัมพันธ์ระหว่างพื้นที่เป็นตารางฟุตและราคาอสังหาริมทรัพย์ในเมืองหนึ่งๆ อย่างไรก็ตามเป็นที่รู้กันว่าอายุของบ้านก็เป็นตัวแปรที่ส่งผลต่อราคาอสังหาริมทรัพย์เช่นกัน

โดยเฉพาะอย่างยิ่งบ้านที่มีอายุมากกว่าอาจมีความสัมพันธ์กับราคาทรัพย์สินที่ลดลง ในกรณีนี้ อายุของบ้านจะเป็น ตัวแปรร่วม เนื่องจากเราไม่ได้สนใจที่จะศึกษามันจริงๆ แต่เรารู้ว่ามันมีผลกระทบต่อราคาบ้าน

ดังนั้นเราจึงสามารถรวมอายุของบ้านเป็นตัวแปรอธิบาย และใช้การถดถอยเชิงเส้นพหุคูณด้วยพื้นที่เป็นตารางฟุตและอายุของบ้านเป็นตัวแปรอธิบาย และราคาบ้านเป็นตัวแปรตอบสนอง

ดังนั้น ค่าสัมประสิทธิ์การถดถอย สำหรับพื้นที่เป็นตารางฟุตจะบอกเราถึงการเปลี่ยนแปลงโดยเฉลี่ยของราคาบ้านที่เกี่ยวข้องกับการเพิ่มขึ้นของพื้นที่เป็นตารางฟุตหนึ่งหน่วย หลังจากพิจารณาอายุของบ้านแล้ว

แหล่งข้อมูลเพิ่มเติม

ข้อมูลเบื้องต้นเกี่ยวกับ ANCOVA (การวิเคราะห์ความแปรปรวน)
วิธีการตีความค่าสัมประสิทธิ์การถดถอย
วิธีดำเนินการ ANCOVA ใน Excel
วิธีการดำเนินการถดถอยเชิงเส้นหลายรายการใน Excel

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *