Яка різниця між т-тестом і anova?
У цьому посібнику пояснюється різниця між t-тестом і ANOVA , а також пояснюється, коли використовувати кожен тест.
Т-тест
Т-критерій використовується, щоб визначити, чи існує статистично значуща різниця між середніми значеннями двох груп . Існує два типи t-тестів:
1. Т-критерій незалежних вибірок. Це використовується, коли ми хочемо порівняти різницю між середніми двома групами, і групи повністю незалежні одна від одної.
Наприклад, дослідники можуть захотіти знати, чи дієта А або дієта Б допомагає людям худнути більше. 100 випадково розподілених людей призначають на дієту А. Ще 100 випадково розподілених людей призначають на дієту Б. Через три місяці дослідники фіксують загальну втрату ваги кожної людини. Щоб визначити, чи суттєво відрізняється середня втрата ваги між двома групами, дослідники можуть виконати t-тест незалежної вибірки.
2. Т-критерій парних вибірок . Це використовується, коли ми хочемо порівняти різницю між середніми значеннями двох груп і коли кожне спостереження з однієї групи можна пов’язати зі спостереженням з іншої групи.
Наприклад, скажімо, 20 учнів у класі складають тест, потім вивчають певний посібник, а потім знову складають тест. Щоб порівняти різницю між результатами першого та другого тесту, ми використовуємо парний t-критерій, оскільки для кожного учня його перший бал тесту можна пов’язати з балом другого тесту.
Щоб t-тест дав дійсні результати, мають бути виконані такі припущення:
- Випадковий: Для збору даних для обох зразків слід використовувати випадкову вибірку або випадковий експеримент.
- Нормальний: розподіл вибірки нормальний або приблизно нормальний.
Якщо ці припущення виконуються, то можна використовувати t-тест для перевірки різниці між середніми двома групами.
ANOVA
ANOVA (дисперсійний аналіз) використовується, щоб визначити, чи існує статистично значуща різниця між середніми значеннями трьох або більше груп . Найпоширенішими тестами ANOVA на практиці є односторонній ANOVA та двосторонній ANOVA:
Односторонній дисперсійний аналіз: використовується, щоб перевірити, чи існує статистично значуща різниця між середніми значеннями трьох або більше груп, коли групи можна розділити за одним фактором .
Приклад: ви випадковим чином розподіляєте клас із 90 студентів на три групи по 30. Кожна група використовує різну методику навчання протягом місяця, щоб підготуватися до іспиту. Наприкінці місяця всі учні складають однаковий іспит. Ви хочете знати, чи впливає техніка навчання на результати іспитів. Отже, ви виконуєте односторонній дисперсійний аналіз, щоб визначити, чи існує статистично значуща різниця між середніми балами трьох груп.
Двосторонній дисперсійний аналіз: використовується, щоб перевірити, чи існує статистично значуща різниця між середніми значеннями трьох або більше груп, коли групи можна розділити за двома факторами .
Приклад: ви хочете визначити, чи впливають на втрату ваги рівень фізичних вправ (без фізичних вправ, легкі вправи, інтенсивні вправи) і стать (чоловіча, жіноча). У цьому випадку два фактори, які ви вивчаєте, – це фізичні вправи та стать, а змінною вашої відповіді є втрата ваги (вимірюється у фунтах). Ви можете виконати двосторонній дисперсійний аналіз, щоб визначити, чи впливають фізичні вправи та стать на втрату ваги, а також визначити, чи існує взаємодія між фізичними вправами та статтю на втрату ваги.
Щоб дисперсійний аналіз дав дійсні результати, мають бути виконані такі припущення:
- Нормальність – усі сукупності, які ми вивчаємо, мають нормальний розподіл. Так, наприклад, якщо ми хочемо порівняти іспитові бали трьох різних груп студентів, іспитові бали першої групи, другої групи та третьої групи повинні розподілятися нормально.
- Рівна дисперсія – дисперсії сукупності в кожній групі рівні або приблизно рівні.
- Незалежність – спостереження кожної групи мають бути незалежними одне від одного. Зазвичай про це піклується рандомізований дизайн .
Якщо ці припущення виконуються, тоді можна використовувати ANOVA, щоб перевірити різницю між середніми значеннями трьох або більше груп.
Зрозумійте відмінності між кожним тестом
Основна відмінність між t-критерієм і дисперсійним аналізом полягає в тому, як обидва тести обчислюють свою тестову статистику, щоб визначити, чи існує статистично значуща різниця між групами.
Т-критерій незалежної вибірки використовує таку тестову статистику:
тестова статистика t = [ ( x 1 – x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )
де x 1 і x 2 — вибіркові середні для груп 1 і 2, d — гіпотетична різниця між двома середніми (часто дорівнює нулю), s 1 2 і s 2 2 — вибіркові дисперсії для груп 1 і 2, і n 1 і n 2 — розміри вибірки для груп 1 і 2 відповідно.
Т-критерій парних зразків використовує таку тестову статистику:
тестова статистика t = d / (s d / √n)
де d — середня різниця між двома групами, s d — стандартне відхилення відмінностей, а n — розмір вибірки для кожної групи (зверніть увагу, що обидві групи матимуть однаковий розмір вибірки).
ANOVA використовує таку тестову статистику:
тестова статистика F = s 2 b / s 2 w
де s 2 b – міжвибіркова дисперсія, а s 2 w – внутрішньовибіркова дисперсія.
Т-тест вимірює відношення середньої різниці між двома групами до загального стандартного відхилення відмінностей. Якщо це співвідношення достатньо високе, це є достатнім доказом того, що існує значна різниця між двома групами.
З іншого боку, ANOVA вимірює співвідношення дисперсії між групами порівняно з дисперсією всередині груп. Подібно до t-критерію, якщо це співвідношення достатньо високе, воно дає достатньо доказів того, що три групи не мають однакового середнього значення.
Ще одна ключова відмінність між t-тестом і дисперсійним аналізом полягає в тому, що t-тест може визначити, чи мають дві групи однакове середнє значення. Дисперсійний аналіз, з іншого боку, повідомляє нам, чи всі три групи мають однакове середнє значення, але він явно не повідомляє нам , які групи мають різні середні значення.
Щоб з’ясувати, які групи відрізняються одна від одної, необхідно було б провести постгок тестування .
Зрозумійте, коли використовувати кожен тест
На практиці, коли ми хочемо порівняти середні значення двох груп , ми використовуємо t-критерій. Коли ми хочемо порівняти середні значення трьох або більше груп , ми використовуємо ANOVA.
Основна причина, чому ми не просто використовуємо кілька t-тестів для порівняння середніх значень трьох або більше груп, сходить до розуміння частоти помилок типу I. Припустімо, ми хочемо порівняти середні значення трьох груп: групи A, групи B і групи C. У вас може виникнути спокуса виконати наступні три t-тести:
- Тест t для порівняння різниці в середніх значеннях між групами А та В
- Тест t для порівняння різниці середніх значень між групою A та групою C
- Тест t для порівняння різниці середніх значень між групою B і групою C
Для кожного t-критерію існує ймовірність того, що ми припустимося помилки типу I , яка є ймовірністю того, що ми відхилимо нульову гіпотезу, коли вона насправді вірна. Зазвичай ця ймовірність становить 5%. Це означає, що коли ми виконуємо кілька t-тестів, частота помилок зростає. Наприклад:
- Імовірність того, що ми припустимося помилки типу I за допомогою одного t-критерію, становить 1 – 0,95 = 0,05 .
- Імовірність того, що ми припустимося помилки типу I за допомогою двох t-тестів, дорівнює 1 – (0,95 2 ) = 0,0975 .
- Імовірність того, що ми припустимося помилки типу I за допомогою двох t-тестів, дорівнює 1 – (0,95 3 ) = 0,1427 .
Цей рівень помилок є неприйнятно високим. На щастя, ANOVA контролює ці помилки, так що помилка типу I залишається лише на рівні 5%. Це дає нам змогу бути більш впевненими, що статистично значущий результат тесту є дійсно значущим, а не просто результатом, який ми отримали під час виконання багатьох тестів.
Отже, коли ми хочемо зрозуміти, чи є різниця між середніми значеннями трьох або більше груп, нам потрібно використовувати ANOVA, щоб наші результати були статистично достовірними та надійними.