อะไรคือความแตกต่างระหว่างการทดสอบ t และ anova?
บทช่วยสอนนี้จะอธิบายความแตกต่างระหว่าง t-test และ ANOVA รวมถึงเวลาที่ควรใช้การทดสอบแต่ละครั้ง
T-ทดสอบ
การทดสอบที ใช้เพื่อพิจารณาว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างค่าเฉลี่ยของ ทั้งสองกลุ่ม หรือไม่ การทดสอบทีมีสองประเภท:
1. ตัวอย่างทดสอบทีอิสระ ใช้เมื่อเราต้องการเปรียบเทียบความแตกต่างระหว่างค่าเฉลี่ยของสองกลุ่มกับกลุ่มที่เป็นอิสระจากกันโดยสิ้นเชิง
ตัวอย่างเช่น นักวิจัยอาจต้องการทราบว่าอาหาร A หรืออาหาร B ช่วยให้ผู้คนลดน้ำหนักได้มากขึ้นหรือไม่ ผู้ที่ได้รับการสุ่ม 100 คนได้รับการสุ่มเลือกทานอาหารประเภท A และอีก 100 คนที่ได้รับการสุ่มเลือกจะได้รับอาหารประเภท B หลังจากผ่านไป 3 เดือน นักวิจัยจะบันทึกการลดน้ำหนักรวมของแต่ละคน เพื่อตรวจสอบว่าการสูญเสียน้ำหนักโดยเฉลี่ยระหว่างทั้งสองกลุ่มมีความแตกต่างกันอย่างมีนัยสำคัญหรือไม่ นักวิจัยสามารถทำการทดสอบตัวอย่างแบบอิสระได้
2. จับคู่ตัวอย่าง t-test ใช้เมื่อเราต้องการเปรียบเทียบความแตกต่างระหว่างค่าเฉลี่ยของสองกลุ่ม และตำแหน่งที่แต่ละการสังเกตจากกลุ่มหนึ่งสามารถเชื่อมโยงกับการสังเกตจากอีกกลุ่มหนึ่งได้
ตัวอย่างเช่น สมมติว่านักเรียน 20 คนในชั้นเรียนทำแบบทดสอบ จากนั้นศึกษาคำแนะนำบางอย่าง จากนั้นจึงทำแบบทดสอบอีกครั้ง เพื่อเปรียบเทียบความแตกต่างระหว่างคะแนนสอบครั้งแรกและครั้งที่สอง เราใช้แบบทดสอบทีคู่ เนื่องจากสำหรับนักเรียนแต่ละคน คะแนนสอบครั้งแรกสามารถเชื่อมโยงกับคะแนนสอบครั้งที่สองได้
เพื่อให้การทดสอบทีได้ผลลัพธ์ที่ถูกต้อง ต้องเป็นไปตามสมมติฐานต่อไปนี้:
- สุ่ม: ควรใช้ตัวอย่างสุ่มหรือการทดลองสุ่มเพื่อรวบรวมข้อมูลสำหรับทั้งสองตัวอย่าง
- ปกติ: การกระจายตัวอย่างเป็นเรื่องปกติหรือประมาณปกติ
หากเป็นไปตามสมมติฐานเหล่านี้ ก็เป็นไปได้ที่จะใช้การทดสอบทีเพื่อทดสอบความแตกต่างระหว่างค่าเฉลี่ยของทั้งสองกลุ่ม
การวิเคราะห์ความแปรปรวน
การวิเคราะห์ ความแปรปรวน (การวิเคราะห์ความแปรปรวน) ใช้เพื่อพิจารณาว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างค่าเฉลี่ยของ สามกลุ่มขึ้นไปหรือ ไม่ การทดสอบ ANOVA ที่ใช้บ่อยที่สุดในทางปฏิบัติคือ One-way ANOVA และ Two-way ANOVA:
การวิเคราะห์ความแปรปรวนแบบทางเดียว: ใช้เพื่อทดสอบว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างค่าเฉลี่ยของกลุ่มตั้งแต่ 3 กลุ่มขึ้นไปหรือไม่ เมื่อกลุ่มสามารถแยกออกจาก ปัจจัยเดียว ได้
ตัวอย่าง: คุณสุ่มแบ่งชั้นเรียนที่มีนักเรียน 90 คนออกเป็นสามกลุ่ม กลุ่มละ 30 คน แต่ละกลุ่มใช้เทคนิคการเรียนที่แตกต่างกันเป็นเวลาหนึ่งเดือนเพื่อเตรียมตัวสอบ สิ้นเดือนนักเรียนทุกคนจะสอบเหมือนกัน อยากรู้ว่าเทคนิคการเรียนมีผลต่อคะแนนสอบหรือไม่ ดังนั้น คุณจึงทำการวิเคราะห์ความแปรปรวนแบบทางเดียวเพื่อดูว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างคะแนนเฉลี่ยของทั้งสามกลุ่มหรือไม่
การวิเคราะห์ความแปรปรวนแบบสองทาง: ใช้เพื่อทดสอบว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างค่าเฉลี่ยของกลุ่มตั้งแต่ 3 กลุ่มขึ้นไปหรือไม่ เมื่อกลุ่มสามารถแบ่งออกเป็น 2 ปัจจัย ได้
ตัวอย่าง: คุณต้องการพิจารณาว่าระดับการออกกำลังกาย (ไม่ออกกำลังกาย ออกกำลังกายเบาๆ ออกกำลังกายหนักๆ) และเพศ (ชาย หญิง) ส่งผลต่อการลดน้ำหนักหรือไม่ ในกรณีนี้ ปัจจัยสองประการที่คุณกำลังศึกษาคือการออกกำลังกายและเพศ และตัวแปรการตอบสนองของคุณคือการลดน้ำหนัก (วัดเป็นปอนด์) คุณสามารถทำการวิเคราะห์ความแปรปรวนแบบสองทางเพื่อตรวจสอบว่าการออกกำลังกายและเพศส่งผลต่อการลดน้ำหนักหรือไม่ และเพื่อพิจารณาว่ามีปฏิสัมพันธ์ระหว่างการออกกำลังกายและเพศต่อการลดน้ำหนักหรือไม่
เพื่อให้ ANOVA ให้ผลลัพธ์ที่ถูกต้อง ต้องเป็นไปตามสมมติฐานต่อไปนี้:
- ภาวะปกติ – ประชากรทั้งหมดที่เราศึกษาเป็นไปตามการแจกแจงแบบปกติ ตัวอย่างเช่น หากเราต้องการเปรียบเทียบคะแนนสอบของนักเรียนสามกลุ่มที่แตกต่างกัน คะแนนสอบของกลุ่มแรก กลุ่มที่สอง และกลุ่มที่สามควรจะแจกแจงแบบปกติทั้งหมด
- ความแปรปรวนเท่ากัน – ความแปรปรวนของประชากรในแต่ละกลุ่มมีค่าเท่ากันหรือเท่ากันโดยประมาณ
- ความเป็นอิสระ – การสังเกตของแต่ละกลุ่มจะต้องเป็นอิสระจากกัน โดยปกติแล้ว การออกแบบแบบสุ่ม จะดูแลเรื่องนี้
หากเป็นไปตามสมมติฐานเหล่านี้ ก็สามารถใช้ ANOVA เพื่อทดสอบความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มตั้งแต่ 3 กลุ่มขึ้นไปได้
เข้าใจความแตกต่างระหว่างการทดสอบแต่ละครั้ง
ความแตกต่างหลักระหว่างการทดสอบทีและการวิเคราะห์ความแปรปรวนคือวิธีที่การทดสอบทั้งสองคำนวณสถิติการทดสอบเพื่อพิจารณาว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างกลุ่มหรือไม่
ตัวอย่างการทดสอบทีอิสระ ใช้สถิติการทดสอบต่อไปนี้:
สถิติทดสอบ t = [ ( x 1 – x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )
โดยที่ x 1 และ x 2 เป็นค่าเฉลี่ยตัวอย่างสำหรับกลุ่ม 1 และ 2, d คือความแตกต่างสมมุติระหว่างทั้งสองค่าเฉลี่ย (มักจะเป็นศูนย์), s 1 2 และ s 2 2 คือความแปรปรวนตัวอย่างสำหรับกลุ่ม 1 และ 2 และ n 1 และ n 2 คือขนาดตัวอย่างสำหรับกลุ่ม 1 และ 2 ตามลำดับ
ตัวอย่างการทดสอบทีแบบจับคู่ จะใช้สถิติการทดสอบต่อไปนี้:
สถิติการทดสอบ t = d / (s d / √n)
โดยที่ d คือความแตกต่างเฉลี่ยระหว่างทั้งสองกลุ่ม s d คือค่าเบี่ยงเบนมาตรฐานของความแตกต่าง และ n คือขนาดตัวอย่างสำหรับแต่ละกลุ่ม (โปรดทราบว่าทั้งสองกลุ่มจะมีขนาดตัวอย่างเท่ากัน)
ANOVA ใช้สถิติการทดสอบต่อไปนี้:
สถิติการทดสอบ F = s 2 b / s 2 w
โดยที่ s 2 b คือความแปรปรวนระหว่างตัวอย่าง และ s 2 w คือความแปรปรวนภายในตัวอย่าง
การทดสอบทีจะวัดอัตราส่วนของความแตกต่างเฉลี่ยระหว่างสองกลุ่มต่อค่าเบี่ยงเบนมาตรฐานโดยรวมของความแตกต่าง หากอัตราส่วนนี้สูงเพียงพอ ก็ถือเป็นหลักฐานเพียงพอว่าทั้งสองกลุ่มมีความแตกต่างกันอย่างมีนัยสำคัญ
ในทางกลับกัน ANOVA จะวัดอัตราส่วนของความแปรปรวนระหว่างกลุ่มเทียบกับความแปรปรวนภายในกลุ่ม เช่นเดียวกับการทดสอบที หากอัตราส่วนนี้สูงเพียงพอ แสดงว่าทั้งสามกลุ่มไม่มีค่าเฉลี่ยเท่ากัน
ข้อแตกต่างที่สำคัญอีกประการระหว่างการทดสอบทีและการวิเคราะห์ความแปรปรวนคือการทดสอบทีสามารถบอกเราว่าสองกลุ่มมีค่าเฉลี่ยเท่ากันหรือไม่ ในทางกลับกัน ANOVA บอกเราว่ากลุ่มทั้งสามกลุ่มมีค่าเฉลี่ยเท่ากันหรือไม่ แต่ไม่ได้บอกเราอย่างชัดเจนว่ากลุ่ม ใด มีค่าเฉลี่ยต่างกัน
หากต้องการทราบว่ากลุ่มใดมีความแตกต่างกัน จำเป็นต้องมี การทดสอบภายหลัง
ทำความเข้าใจว่าเมื่อใดควรใช้แบบทดสอบแต่ละครั้ง
ในทางปฏิบัติ เมื่อเราต้องการเปรียบเทียบค่าเฉลี่ยของ สอง กลุ่ม เราจะใช้การทดสอบที เมื่อเราต้องการเปรียบเทียบค่าเฉลี่ยของ กลุ่มตั้งแต่ 3 กลุ่มขึ้นไป เราจะใช้ ANOVA
เหตุผลเบื้องหลังที่เราไม่เพียงแค่ใช้การทดสอบทีหลายรายการเพื่อเปรียบเทียบค่าเฉลี่ยของกลุ่มสามกลุ่มขึ้นไป เป็นการย้อนกลับไปทำความเข้าใจอัตราความผิดพลาดประเภทที่ 1 สมมติว่าเราต้องการเปรียบเทียบค่าเฉลี่ย ของสามกลุ่ม: กลุ่ม A, กลุ่ม B และกลุ่ม C คุณอาจถูกล่อลวงให้ทำการทดสอบทีสามรายการต่อไปนี้:
- การทดสอบเพื่อเปรียบเทียบความแตกต่างในค่าเฉลี่ยระหว่างกลุ่ม A และกลุ่ม B
- การทดสอบเพื่อเปรียบเทียบความแตกต่างในค่าเฉลี่ยระหว่างกลุ่ม A และกลุ่ม C
- การทดสอบเพื่อเปรียบเทียบความแตกต่างในค่าเฉลี่ยระหว่างกลุ่ม B และกลุ่ม C
สำหรับการทดสอบทีแต่ละครั้ง มีโอกาสที่เราทำ ข้อผิดพลาดประเภท 1 ซึ่งเป็นความน่าจะเป็นที่เราปฏิเสธสมมติฐานว่างเมื่อเป็นจริง ความน่าจะเป็นนี้โดยทั่วไปคือ 5% ซึ่งหมายความว่าเมื่อเราทำการทดสอบทีหลายครั้ง อัตราข้อผิดพลาดนี้จะเพิ่มขึ้น ตัวอย่างเช่น:
- ความน่าจะเป็นที่เราทำข้อผิดพลาดประเภท 1 ด้วยการทดสอบทีครั้งเดียวคือ 1 – 0.95 = 0.05
- ความน่าจะเป็นที่เราทำข้อผิดพลาดประเภท 1 ด้วยการทดสอบทีสองครั้งคือ 1 – (0.95 2 ) = 0.0975
- ความน่าจะเป็นที่เราจะทำข้อผิดพลาดประเภท 1 ด้วยการทดสอบทีสองครั้งคือ 1 – (0.95 3 ) = 0.1427
อัตราข้อผิดพลาดนี้สูงจนไม่สามารถยอมรับได้ โชคดีที่ ANOVA ควบคุมข้อผิดพลาดเหล่านี้ เพื่อให้ข้อผิดพลาดประเภท I เหลือเพียง 5% สิ่งนี้ช่วยให้เรามั่นใจมากขึ้นว่าผลการทดสอบที่มีนัยสำคัญทางสถิตินั้นมีความหมายจริงๆ และไม่ใช่แค่ผลลัพธ์ที่เราได้รับจากการทดสอบจำนวนมาก
ดังนั้น เมื่อเราต้องการเข้าใจว่าค่าเฉลี่ยของกลุ่มตั้งแต่ 3 กลุ่มขึ้นไปมีความแตกต่างกันหรือไม่ เราจำเป็นต้องใช้ ANOVA เพื่อให้ผลลัพธ์ของเรามีความถูกต้องทางสถิติและเชื่อถือได้