ความแปรปรวนอธิบายอะไรได้บ้าง? (คำจำกัดความ & #038; ตัวอย่าง)


ความแปรปรวนที่อธิบาย (บางครั้งเรียกว่า “ความแปรปรวนที่อธิบาย”) หมายถึงความแปรปรวนของตัวแปรตอบสนองในแบบจำลองที่สามารถอธิบายได้ด้วยตัวแปรทำนายของแบบจำลอง

ยิ่งความแปรปรวนที่อธิบายไว้ของแบบจำลองสูงเท่าใด ข้อมูลก็จะยิ่งสามารถอธิบายความแปรปรวนได้มากขึ้นเท่านั้น

ความแปรปรวนที่อธิบายไว้ปรากฏในผลลัพธ์ของแบบจำลองทางสถิติที่แตกต่างกันสองแบบ:

1. ANOVA: ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของกลุ่มอิสระตั้งแต่ 3 กลุ่มขึ้นไป

2. การถดถอย: ใช้เพื่อหาปริมาณความสัมพันธ์ระหว่างตัวแปรทำนายตั้งแต่หนึ่งตัวขึ้นไปและตัวแปรตอบสนอง

ตัวอย่างต่อไปนี้แสดงวิธีตีความความแปรปรวนคงเหลือในแต่ละวิธีเหล่านี้

หมายเหตุ : สิ่งที่ตรงกันข้ามกับความแปรปรวนที่อธิบายไว้เรียกว่าความ แปรปรวนคงเหลือ

ความแปรปรวนที่อธิบายไว้ในแบบจำลอง ANOVA

ทุกครั้งที่เราปรับโมเดล ANOVA (“การวิเคราะห์ความแปรปรวน”) ให้เหมาะสม เราจะได้ตาราง ANOVA ที่มีลักษณะดังนี้:

ความแปรปรวนที่อธิบายไว้มีอยู่ในคอลัมน์ SS (“ผลรวมของกำลังสอง”) สำหรับ การแปรผันระหว่างกลุ่ม

ในโมเดล ANOVA ข้างต้น เราจะเห็นว่าความแปรปรวนที่อธิบายไว้คือ 192.2

เพื่อตรวจสอบว่าความแปรปรวนที่อธิบายไว้นี้ “สูง” หรือไม่ เราสามารถคำนวณผลรวมเฉลี่ยของกำลังสองสำหรับภายในกลุ่มและผลรวมเฉลี่ยของกำลังสองสำหรับระหว่างกลุ่ม แล้วค้นหาอัตราส่วนระหว่างทั้งสอง ซึ่งให้ค่า F โดยรวมในตาราง ANOVA

  • F = MS เข้า / MS เข้า
  • ฟ = 96.1 / 40.76296
  • เอฟ = 2.357

ค่า F ในตาราง ANOVA ด้านบนคือ 2.357 และค่า p ที่สอดคล้องกันคือ 0.113848

เนื่องจากค่า p นี้ไม่น้อยกว่า α = 0.05 เราจึงไม่มีหลักฐานเพียงพอที่จะปฏิเสธ สมมติฐานว่างของ ANOVA

ซึ่งหมายความว่าเราไม่มีหลักฐานเพียงพอที่จะบอกว่าความแตกต่างเฉลี่ยระหว่างกลุ่มที่เรากำลังเปรียบเทียบนั้นแตกต่างกันอย่างมีนัยสำคัญ

สิ่งนี้บอกเราว่าความแปรปรวนที่อธิบายไว้ในแบบจำลอง ANOVA นั้นมีขนาดเล็กเมื่อเทียบกับความแปรปรวนที่ไม่สามารถอธิบายได้

ความแปรปรวนที่อธิบายไว้ในแบบจำลองการถดถอย

ในแบบจำลองการถดถอย ความแปรปรวนที่อธิบายไว้จะสรุปเป็น R-squared ซึ่งมักเขียนเป็น R2

ค่านี้แสดงถึงสัดส่วนของความแปรปรวนในตัวแปรตอบสนองที่สามารถอธิบายได้ด้วยตัวแปรทำนายในแบบจำลอง

ค่าของ R กำลังสองสามารถอยู่ในช่วงตั้งแต่ 0 ถึงโดยที่:

  • ค่า 0 บ่งชี้ว่าตัวแปรตอบสนองไม่สามารถอธิบายได้ด้วยตัวแปรทำนายเลย
  • ค่า 1 บ่งชี้ว่าตัวแปรตัวทำนายสามารถอธิบายตัวแปรตอบสนองได้อย่างสมบูรณ์แบบโดยไม่มีข้อผิดพลาด

เมื่อเราพอดีกับแบบจำลองการถดถอย เรามักจะได้รับผลลัพธ์ที่มีลักษณะดังนี้:

เราจะเห็นได้ว่าความแปรปรวนที่อธิบายไว้คือ 168.5976 และความแปรปรวนรวมคือ 174.5

เมื่อใช้ค่าเหล่านี้ เราสามารถคำนวณค่า R-squared สำหรับโมเดลการถดถอยนี้ได้ดังนี้:

  • R กำลังสอง: การถดถอย SS / รวม SS
  • R กำลังสอง: 168.5976 / 174.5
  • R กำลังสอง: 0.966

เนื่องจากค่า R-squared ของแบบจำลองนี้ใกล้กับ 1 จึงบอกเราว่าความแปรปรวนที่อธิบายในแบบจำลองนั้นสูงมาก

กล่าวอีกนัยหนึ่ง โมเดลสามารถทำงานได้ดีในการใช้ตัวแปรทำนายเพื่ออธิบายความแปรผันของตัวแปรตอบสนอง

ที่เกี่ยวข้อง: ค่า R-squared ที่ดีคืออะไร?

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *