ความแปรปรวนอธิบายอะไรได้บ้าง? (คำจำกัดความ & #038; ตัวอย่าง)

โดย ดร.เบนจามิน แอนเดอร์สัน กรกฎาคม 18, 2023 แนะนำ 0 ความคิดเห็น

ความแปรปรวนที่อธิบาย (บางครั้งเรียกว่า “ความแปรปรวนที่อธิบาย”) หมายถึงความแปรปรวนของตัวแปรตอบสนองในแบบจำลองที่สามารถอธิบายได้ด้วยตัวแปรทำนายของแบบจำลอง

ยิ่งความแปรปรวนที่อธิบายไว้ของแบบจำลองสูงเท่าใด ข้อมูลก็จะยิ่งสามารถอธิบายความแปรปรวนได้มากขึ้นเท่านั้น

ความแปรปรวนที่อธิบายไว้ปรากฏในผลลัพธ์ของแบบจำลองทางสถิติที่แตกต่างกันสองแบบ:

1. ANOVA: ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของกลุ่มอิสระตั้งแต่ 3 กลุ่มขึ้นไป

2. การถดถอย: ใช้เพื่อหาปริมาณความสัมพันธ์ระหว่างตัวแปรทำนายตั้งแต่หนึ่งตัวขึ้นไปและตัวแปรตอบสนอง

ตัวอย่างต่อไปนี้แสดงวิธีตีความความแปรปรวนคงเหลือในแต่ละวิธีเหล่านี้

หมายเหตุ : สิ่งที่ตรงกันข้ามกับความแปรปรวนที่อธิบายไว้เรียกว่าความ แปรปรวนคงเหลือ

ความแปรปรวนที่อธิบายไว้ในแบบจำลอง ANOVA

ทุกครั้งที่เราปรับโมเดล ANOVA (“การวิเคราะห์ความแปรปรวน”) ให้เหมาะสม เราจะได้ตาราง ANOVA ที่มีลักษณะดังนี้:

ความแปรปรวนที่อธิบายไว้มีอยู่ในคอลัมน์ SS (“ผลรวมของกำลังสอง”) สำหรับ การแปรผันระหว่างกลุ่ม

ในโมเดล ANOVA ข้างต้น เราจะเห็นว่าความแปรปรวนที่อธิบายไว้คือ 192.2

เพื่อตรวจสอบว่าความแปรปรวนที่อธิบายไว้นี้ “สูง” หรือไม่ เราสามารถคำนวณผลรวมเฉลี่ยของกำลังสองสำหรับภายในกลุ่มและผลรวมเฉลี่ยของกำลังสองสำหรับระหว่างกลุ่ม แล้วค้นหาอัตราส่วนระหว่างทั้งสอง ซึ่งให้ค่า F โดยรวมในตาราง ANOVA

F = MS _เข้า / MS _เข้า
ฟ = 96.1 / 40.76296
เอฟ = 2.357

ค่า F ในตาราง ANOVA ด้านบนคือ 2.357 และค่า p ที่สอดคล้องกันคือ 0.113848

เนื่องจากค่า p นี้ไม่น้อยกว่า α = 0.05 เราจึงไม่มีหลักฐานเพียงพอที่จะปฏิเสธ สมมติฐานว่างของ ANOVA

ซึ่งหมายความว่าเราไม่มีหลักฐานเพียงพอที่จะบอกว่าความแตกต่างเฉลี่ยระหว่างกลุ่มที่เรากำลังเปรียบเทียบนั้นแตกต่างกันอย่างมีนัยสำคัญ

สิ่งนี้บอกเราว่าความแปรปรวนที่อธิบายไว้ในแบบจำลอง ANOVA นั้นมีขนาดเล็กเมื่อเทียบกับความแปรปรวนที่ไม่สามารถอธิบายได้

ความแปรปรวนที่อธิบายไว้ในแบบจำลองการถดถอย

ในแบบจำลองการถดถอย ความแปรปรวนที่อธิบายไว้จะสรุปเป็น R-squared ซึ่งมักเขียนเป็น ^R2

ค่านี้แสดงถึงสัดส่วนของความแปรปรวนในตัวแปรตอบสนองที่สามารถอธิบายได้ด้วยตัวแปรทำนายในแบบจำลอง

ค่าของ R กำลังสองสามารถอยู่ในช่วงตั้งแต่ 0 ถึงโดยที่:

ค่า 0 บ่งชี้ว่าตัวแปรตอบสนองไม่สามารถอธิบายได้ด้วยตัวแปรทำนายเลย
ค่า 1 บ่งชี้ว่าตัวแปรตัวทำนายสามารถอธิบายตัวแปรตอบสนองได้อย่างสมบูรณ์แบบโดยไม่มีข้อผิดพลาด

เมื่อเราพอดีกับแบบจำลองการถดถอย เรามักจะได้รับผลลัพธ์ที่มีลักษณะดังนี้:

เราจะเห็นได้ว่าความแปรปรวนที่อธิบายไว้คือ 168.5976 และความแปรปรวนรวมคือ 174.5

เมื่อใช้ค่าเหล่านี้ เราสามารถคำนวณค่า R-squared สำหรับโมเดลการถดถอยนี้ได้ดังนี้:

R กำลังสอง: การถดถอย SS / รวม SS
R กำลังสอง: 168.5976 / 174.5
R กำลังสอง: 0.966

เนื่องจากค่า R-squared ของแบบจำลองนี้ใกล้กับ 1 จึงบอกเราว่าความแปรปรวนที่อธิบายในแบบจำลองนั้นสูงมาก

กล่าวอีกนัยหนึ่ง โมเดลสามารถทำงานได้ดีในการใช้ตัวแปรทำนายเพื่ออธิบายความแปรผันของตัวแปรตอบสนอง

ที่เกี่ยวข้อง: ค่า R-squared ที่ดีคืออะไร?

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

สวัสดี ฉันชื่อเบนจามิน ศาสตราจารย์สถิติเกษียณอายุแล้ว และผันตัวมาเป็นครูสอนสถิติโดยเฉพาะ ด้วยประสบการณ์และความเชี่ยวชาญที่กว้างขวางในสาขาสถิติ ฉันกระตือรือร้นที่จะแบ่งปันความรู้ของฉันเพื่อเสริมศักยภาพนักเรียนผ่าน Statorials. รู้เพิ่มเติม

ความแปรปรวนที่อธิบายไว้ในแบบจำลอง ANOVA

ความแปรปรวนที่อธิบายไว้ในแบบจำลองการถดถอย

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

เพิ่มความคิดเห็น