ความแปรปรวนอธิบายอะไรได้บ้าง? (คำจำกัดความ & #038; ตัวอย่าง)
ความแปรปรวนที่อธิบาย (บางครั้งเรียกว่า “ความแปรปรวนที่อธิบาย”) หมายถึงความแปรปรวนของตัวแปรตอบสนองในแบบจำลองที่สามารถอธิบายได้ด้วยตัวแปรทำนายของแบบจำลอง
ยิ่งความแปรปรวนที่อธิบายไว้ของแบบจำลองสูงเท่าใด ข้อมูลก็จะยิ่งสามารถอธิบายความแปรปรวนได้มากขึ้นเท่านั้น
ความแปรปรวนที่อธิบายไว้ปรากฏในผลลัพธ์ของแบบจำลองทางสถิติที่แตกต่างกันสองแบบ:
1. ANOVA: ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของกลุ่มอิสระตั้งแต่ 3 กลุ่มขึ้นไป
2. การถดถอย: ใช้เพื่อหาปริมาณความสัมพันธ์ระหว่างตัวแปรทำนายตั้งแต่หนึ่งตัวขึ้นไปและตัวแปรตอบสนอง
ตัวอย่างต่อไปนี้แสดงวิธีตีความความแปรปรวนคงเหลือในแต่ละวิธีเหล่านี้
หมายเหตุ : สิ่งที่ตรงกันข้ามกับความแปรปรวนที่อธิบายไว้เรียกว่าความ แปรปรวนคงเหลือ
ความแปรปรวนที่อธิบายไว้ในแบบจำลอง ANOVA
ทุกครั้งที่เราปรับโมเดล ANOVA (“การวิเคราะห์ความแปรปรวน”) ให้เหมาะสม เราจะได้ตาราง ANOVA ที่มีลักษณะดังนี้:
ความแปรปรวนที่อธิบายไว้มีอยู่ในคอลัมน์ SS (“ผลรวมของกำลังสอง”) สำหรับ การแปรผันระหว่างกลุ่ม
ในโมเดล ANOVA ข้างต้น เราจะเห็นว่าความแปรปรวนที่อธิบายไว้คือ 192.2
เพื่อตรวจสอบว่าความแปรปรวนที่อธิบายไว้นี้ “สูง” หรือไม่ เราสามารถคำนวณผลรวมเฉลี่ยของกำลังสองสำหรับภายในกลุ่มและผลรวมเฉลี่ยของกำลังสองสำหรับระหว่างกลุ่ม แล้วค้นหาอัตราส่วนระหว่างทั้งสอง ซึ่งให้ค่า F โดยรวมในตาราง ANOVA
- F = MS เข้า / MS เข้า
- ฟ = 96.1 / 40.76296
- เอฟ = 2.357
ค่า F ในตาราง ANOVA ด้านบนคือ 2.357 และค่า p ที่สอดคล้องกันคือ 0.113848
เนื่องจากค่า p นี้ไม่น้อยกว่า α = 0.05 เราจึงไม่มีหลักฐานเพียงพอที่จะปฏิเสธ สมมติฐานว่างของ ANOVA
ซึ่งหมายความว่าเราไม่มีหลักฐานเพียงพอที่จะบอกว่าความแตกต่างเฉลี่ยระหว่างกลุ่มที่เรากำลังเปรียบเทียบนั้นแตกต่างกันอย่างมีนัยสำคัญ
สิ่งนี้บอกเราว่าความแปรปรวนที่อธิบายไว้ในแบบจำลอง ANOVA นั้นมีขนาดเล็กเมื่อเทียบกับความแปรปรวนที่ไม่สามารถอธิบายได้
ความแปรปรวนที่อธิบายไว้ในแบบจำลองการถดถอย
ในแบบจำลองการถดถอย ความแปรปรวนที่อธิบายไว้จะสรุปเป็น R-squared ซึ่งมักเขียนเป็น R2
ค่านี้แสดงถึงสัดส่วนของความแปรปรวนในตัวแปรตอบสนองที่สามารถอธิบายได้ด้วยตัวแปรทำนายในแบบจำลอง
ค่าของ R กำลังสองสามารถอยู่ในช่วงตั้งแต่ 0 ถึงโดยที่:
- ค่า 0 บ่งชี้ว่าตัวแปรตอบสนองไม่สามารถอธิบายได้ด้วยตัวแปรทำนายเลย
- ค่า 1 บ่งชี้ว่าตัวแปรตัวทำนายสามารถอธิบายตัวแปรตอบสนองได้อย่างสมบูรณ์แบบโดยไม่มีข้อผิดพลาด
เมื่อเราพอดีกับแบบจำลองการถดถอย เรามักจะได้รับผลลัพธ์ที่มีลักษณะดังนี้:
เราจะเห็นได้ว่าความแปรปรวนที่อธิบายไว้คือ 168.5976 และความแปรปรวนรวมคือ 174.5
เมื่อใช้ค่าเหล่านี้ เราสามารถคำนวณค่า R-squared สำหรับโมเดลการถดถอยนี้ได้ดังนี้:
- R กำลังสอง: การถดถอย SS / รวม SS
- R กำลังสอง: 168.5976 / 174.5
- R กำลังสอง: 0.966
เนื่องจากค่า R-squared ของแบบจำลองนี้ใกล้กับ 1 จึงบอกเราว่าความแปรปรวนที่อธิบายในแบบจำลองนั้นสูงมาก
กล่าวอีกนัยหนึ่ง โมเดลสามารถทำงานได้ดีในการใช้ตัวแปรทำนายเพื่ออธิบายความแปรผันของตัวแปรตอบสนอง
ที่เกี่ยวข้อง: ค่า R-squared ที่ดีคืออะไร?