การวิเคราะห์ความแปรปรวน (anova)
บทความนี้จะอธิบายว่าการวิเคราะห์ความแปรปรวนหรือที่เรียกว่า ANOVA คืออะไรในสถิติ ดังนั้น คุณจะค้นพบวิธีการวิเคราะห์ความแปรปรวน ตาราง ANOVA คืออะไร และแบบฝึกหัดที่มีการแก้ไขทีละขั้นตอน นอกจากนี้ ยังแสดงให้เห็นว่าข้อสันนิษฐานก่อนหน้าใดบ้างที่ต้องเคารพในการวิเคราะห์ความแปรปรวน และสุดท้ายคือข้อดีและข้อเสียของการวิเคราะห์ ANOVA
การวิเคราะห์ความแปรปรวน (ANOVA) คืออะไร?
ในสถิติ การวิเคราะห์ความแปรปรวน หรือที่เรียกว่า ANOVA (การวิเคราะห์ความแปรปรวน) เป็นเทคนิคที่ช่วยให้คุณเปรียบเทียบความแปรปรวนระหว่างค่าเฉลี่ยของกลุ่มตัวอย่างต่างๆ
การวิเคราะห์ความแปรปรวน (ANOVA) ใช้เพื่อวิเคราะห์ว่ามีความแตกต่างระหว่างค่าเฉลี่ยของประชากรมากกว่าสองกลุ่มหรือไม่ ดังนั้น การวิเคราะห์ความแปรปรวนช่วยให้เราสามารถระบุได้ว่าค่าเฉลี่ยประชากรของกลุ่มสองกลุ่มขึ้นไปมีความแตกต่างกันหรือไม่ โดยการวิเคราะห์ความแปรปรวนระหว่างค่าเฉลี่ยตัวอย่าง
สมมติฐานว่างของการวิเคราะห์ความแปรปรวนคือค่าเฉลี่ยของกลุ่มทั้งหมดที่วิเคราะห์เท่ากัน ในขณะที่สมมติฐานทางเลือกถือว่าอย่างน้อยหนึ่งวิธีมีความแตกต่างกัน
ดังนั้น การวิเคราะห์ความแปรปรวนจึงมีประโยชน์อย่างยิ่งสำหรับการเปรียบเทียบค่าเฉลี่ยของกลุ่มมากกว่าสองกลุ่ม เนื่องจากด้วยการวิเคราะห์ประเภทนี้ คุณสามารถศึกษาค่าเฉลี่ยของทุกกลุ่มได้พร้อมๆ กัน แทนที่จะเปรียบเทียบค่าเฉลี่ยเป็นคู่ ด้านล่างนี้เราจะดูว่าข้อดีและข้อเสียของการวิเคราะห์ความแปรปรวนคืออะไร
ตารางความแปรปรวน
การวิเคราะห์ความแปรปรวนสรุปไว้ในตารางที่เรียกว่า ตาราง ANOVA โดยมีสูตรดังนี้

ทอง:
-
คือขนาดตัวอย่าง i
-
คือจำนวนการสังเกตทั้งหมด
-
คือจำนวนกลุ่มต่างๆ ในการวิเคราะห์ความแปรปรวน
-
คือค่า j ของกลุ่ม i
-
คือค่าเฉลี่ยของกลุ่ม i
-
นี่คือค่าเฉลี่ยของข้อมูลที่วิเคราะห์ทั้งหมด
ตัวอย่างการวิเคราะห์ความแปรปรวน (ANOVA)
เพื่อทำความเข้าใจแนวคิดของ ANOVA ให้เสร็จสิ้น เรามาดูวิธีวิเคราะห์ความแปรปรวนด้วยการแก้ตัวอย่างทีละขั้นตอน
- มีการศึกษาทางสถิติเพื่อเปรียบเทียบคะแนนที่ได้รับจากนักเรียนสี่คนในสามวิชาที่แตกต่างกัน (A, B และ C) ตารางต่อไปนี้แสดงรายละเอียดคะแนนที่นักเรียนแต่ละคนได้รับจากการทดสอบด้วยคะแนนสูงสุด 20 ทำการวิเคราะห์ความแปรปรวนเพื่อเปรียบเทียบคะแนนที่นักเรียนแต่ละคนได้รับในแต่ละวิชา

สมมติฐานว่างของการวิเคราะห์ความแปรปรวนนี้คือค่าเฉลี่ยของคะแนนของทั้งสามวิชาเท่ากัน ในทางกลับกัน สมมติฐานว่างก็คือว่าค่าเฉลี่ยบางส่วนแตกต่างกัน
ในการวิเคราะห์ความแปรปรวน สิ่งแรกที่ต้องทำคือการคำนวณค่าเฉลี่ยของแต่ละวิชาและค่าเฉลี่ยรวมของข้อมูล:
เมื่อเราทราบค่าของค่าเฉลี่ยแล้ว เราจะคำนวณผลรวมของกำลังสองโดยใช้สูตรการวิเคราะห์ความแปรปรวน (ANOVA) ที่เห็นด้านบน:
จากนั้นเราจะกำหนดระดับความเป็นอิสระของปัจจัย ข้อผิดพลาด และผลรวม:
ตอนนี้เราคำนวณค่าคลาดเคลื่อนกำลังสองเฉลี่ยโดยการหารผลรวมของกำลังสองของตัวประกอบและค่าคลาดเคลื่อนตามระดับความเป็นอิสระตามลำดับ:
และสุดท้าย เราคำนวณค่าของสถิติ F โดยการหารข้อผิดพลาดทั้งสองที่คำนวณในขั้นตอนก่อนหน้า:
กล่าวโดยสรุป ตาราง ANOVA สำหรับข้อมูลตัวอย่างจะมีลักษณะดังนี้:

เมื่อคำนวณค่าทั้งหมดในตาราง ANOVA แล้ว สิ่งที่เหลืออยู่คือการตีความผลลัพธ์ที่ได้รับ ในการทำเช่นนี้ เราจำเป็นต้องค้นหาความน่าจะเป็นที่จะได้ค่าที่มากกว่าสถิติ F ในการแจกแจงของ Snedecor F โดยมีระดับความเป็นอิสระที่สอดคล้องกัน นั่นคือ เราต้องกำหนดค่า p ของการทดสอบ:
ควรสังเกตว่าขณะนี้มีโปรแกรมคอมพิวเตอร์หลายโปรแกรมที่สามารถทำการวิเคราะห์ความแปรปรวนได้ในเวลาเพียงไม่กี่วินาที อย่างไรก็ตาม การรู้ทฤษฎีเบื้องหลังการคำนวณก็เป็นสิ่งสำคัญเช่นกัน
สมมติฐานการวิเคราะห์ความแปรปรวน (ANOVA)
เพื่อที่จะวิเคราะห์ความแปรปรวน (ANOVA) จะต้องเป็นไปตามเงื่อนไขต่อไปนี้:
- ความเป็นอิสระ : ค่าที่สังเกตได้มีความเป็นอิสระจากกัน วิธีหนึ่งที่จะรับประกันความเป็นอิสระของการสังเกตคือการเพิ่มการสุ่มให้กับกระบวนการสุ่มตัวอย่าง
- Homoscedasticity : ความแปรปรวนจะต้องมีความสม่ำเสมอ กล่าวคือ ความแปรปรวนของค่าคงเหลือคงที่
- ความปกติ : ส่วนที่เหลือควรกระจายตามปกติ หรือกล่าวอีกนัยหนึ่ง ควรเป็นไปตามการกระจายแบบปกติ
- ความต่อเนื่อง : ตัวแปรตามจะต้องต่อเนื่อง
ประเภทของการวิเคราะห์ความแปรปรวน (ANOVA)
การวิเคราะห์ความแปรปรวน (ANOVA) มีสามประเภท :
- การวิเคราะห์ความแปรปรวนทางเดียว (one-way ANOVA) : ในการวิเคราะห์ความแปรปรวนมีเพียงปัจจัยเดียวเท่านั้น กล่าวคือ มีตัวแปรอิสระเพียงตัวเดียวเท่านั้น
- การวิเคราะห์ความแปรปรวนแบบสองทาง (การวิเคราะห์ความแปรปรวนแบบสองทาง) : การวิเคราะห์ความแปรปรวนมีสองปัจจัย ดังนั้นตัวแปรอิสระสองตัวและปฏิสัมพันธ์ระหว่างตัวแปรทั้งสองจึงได้รับการวิเคราะห์
- การวิเคราะห์ความแปรปรวนหลายตัวแปร (MANOVA) : ในการวิเคราะห์ความแปรปรวน จะมีตัวแปรตามมากกว่าหนึ่งตัวแปร เป้าหมายคือการพิจารณาว่าตัวแปรอิสระเปลี่ยนค่าหรือไม่เมื่อตัวแปรตามแปรผัน
ข้อดีและข้อเสียของการวิเคราะห์ความแปรปรวน (ANOVA)
สุดท้าย เราจะดูว่าเมื่อใดจึงเหมาะสมสำหรับเราที่จะใช้การวิเคราะห์ความแปรปรวน และอะไรคือขีดจำกัดของการวิเคราะห์ทางสถิติประเภทนี้
ข้อได้เปรียบหลักของการวิเคราะห์ความแปรปรวน (ANOVA) คือทำให้สามารถเปรียบเทียบมากกว่าสองกลุ่มในเวลาเดียวกันได้ ต่างจาก การทดสอบ t-test ที่คุณสามารถวิเคราะห์ค่าเฉลี่ยของกลุ่มตัวอย่างได้เพียง 1 หรือ 2 ตัวอย่างเท่านั้น การวิเคราะห์ความแปรปรวนจะใช้เพื่อพิจารณาว่าประชากรหลายกลุ่มมีค่าเฉลี่ยเท่ากันหรือไม่
อย่างไรก็ตาม การวิเคราะห์ความแปรปรวนไม่ได้บอกเราว่ากลุ่มการศึกษาใดมีค่าเฉลี่ยที่แตกต่างกัน เพียงช่วยให้เราทราบว่ามีค่าเฉลี่ยที่แตกต่างกันอย่างมีนัยสำคัญ หรือหากค่าเฉลี่ยทั้งหมดคล้ายกัน
ในทำนองเดียวกัน ข้อเสียอีกประการหนึ่งของการวิเคราะห์ความแปรปรวนคือต้องเป็นไปตามสมมติฐานก่อนหน้านี้สี่ข้อ (ดูด้านบน) เพื่อทำการวิเคราะห์ ANOVA มิฉะนั้นข้อสรุปที่สรุปได้อาจผิด ดังนั้นจึงควรตรวจสอบเสมอว่าชุดข้อมูลทางสถิติตรงตามข้อกำหนดทั้งสี่ข้อนี้