Як вручну виконати односторонній дисперсійний аналіз
Односторонній дисперсійний аналіз («дисперсійний аналіз») порівнює середні значення трьох або більше незалежних груп, щоб визначити, чи існує статистично значуща різниця між середніми значеннями відповідної сукупності.
У цьому посібнику пояснюється, як вручну виконати односторонній дисперсійний аналіз.
Приклад: ручний односторонній дисперсійний аналіз
Припустімо, ми хочемо знати, чи три різні програми підготовки до іспиту призводять до різних середніх балів на даному іспиті. Щоб перевірити це, ми набираємо 30 студентів для участі в дослідженні та ділимо їх на три групи.
Студенти в кожній групі випадковим чином розподіляються для використання однієї з трьох програм підготовки до іспиту протягом наступних трьох тижнів для підготовки до іспиту. Після закінчення трьох тижнів усі студенти складають один і той же іспит.
Результати іспитів для кожної групи наведені нижче:
Виконайте такі кроки, щоб вручну виконати односторонній дисперсійний аналіз, щоб визначити, чи відрізняється середній бал іспиту між трьома групами:
Крок 1: Обчисліть середнє групове та загальне середнє значення.
Спочатку ми обчислимо середнє значення трьох груп, а також загальне середнє:
Крок 2: Обчисліть SSR.
Далі ми розрахуємо регресію суми квадратів (SSR) за такою формулою:
nΣ(X j – X ..) 2
золото:
- n : розмір вибірки групи j
- Σ : грецький символ, що означає «сума»
- X j : середнє значення групи j
- X .. : загальне середнє
У нашому прикладі ми обчислюємо, що SSR = 10(83,4-85,8) 2 + 10(89,3-85,8) 2 + 10(84,7-85,8) 2 = 192,2
Крок 3: розрахувати SES.
Далі ми обчислимо суму квадратів помилок (SSE) за такою формулою:
Σ(X ij – X j ) 2
золото:
- Σ : грецький символ, що означає «сума»
- X ij : i-те спостереження групи j
- X j : середнє значення групи j
У нашому прикладі ми обчислюємо SSE наступним чином:
Група 1: (85-83,4) 2 + (86-83,4) 2 + (88-83,4) 2 + (75-83,4) 2 + (78-83,4) 2 + (94-83,4) 2 + (98-83,4) 2 + (79-83,4) 2 + (71-83,4) 2 + (80-83,4) 2 = 640,4
Група 2: (91-89,3) 2 + (92-89,3) 2 + (93-89,3) 2 + (85-89,3) 2 + (87-89,3) 2 + (84-89,3) 2 + (82-89,3) 2 + (88-89,3) 2 + (95-89,3) 2 + (96-89,3) 2 = 208,1
3 група: (79-84,7) 2 + (78-84,7) 2 + (88-84,7) 2 + (94-84,7) 2 + (92-84,7) 2 + (85-84,7) 2 + (83-84,7) 2 + (85-84,7) 2 + (82-84,7) 2 + (81-84,7) 2 = 252,1
ESS: 640,4 + 208,1 + 252,1 = 1100,6
Крок 4: Обчисліть SST.
Далі ми обчислимо загальну суму квадратів (SST) за такою формулою:
SST = SSR + SSE
У нашому прикладі SST = 192,2 + 1100,6 = 1292,8
Крок 5: Заповніть таблицю ANOVA.
Тепер, коли у нас є SSR, SSE і SST, ми можемо заповнити таблицю ANOVA:
Джерело | Сума квадратів (SS) | df | Середні квадрати (MS) | Ф |
---|---|---|---|---|
Лікування | 192.2 | 2 | 96.1 | 2,358 |
Помилка | 1100,6 | 27 | 40.8 | |
Всього | 1292,8 | 29 |
Ось як ми розрахували різні числа в таблиці:
- лікування df: k-1 = 3-1 = 2
- помилка df: nk = 30-3 = 27
- загальний df: n-1 = 30-1 = 29
- Лікування SEP: лікування SST / df = 192,2 / 2 = 96,1
- Помилка MS: помилка SSE / df = 1100,6 / 27 = 40,8
- F: обробка MS / помилка MS = 96,1 / 40,8 = 2,358
Примітка: n = загальна кількість спостережень, k = кількість груп
Крок 6: Інтерпретація результатів.
Статистика F-тесту для цього одностороннього дисперсійного аналізу становить 2,358 . Щоб визначити, чи є це статистично значущим результатом, нам потрібно порівняти його з критичним значенням F, знайденим у таблиці розподілу F із такими значеннями:
- α (рівень значущості) = 0,05
- DF1 (ступені свободи чисельника) = df обробки = 2
- DF2 (ступені свободи знаменника) = помилка df = 27
Ми знаходимо, що критичне значення F дорівнює 3,3541 .
Оскільки F-статистика тесту в таблиці ANOVA менша за критичне значення F у таблиці F-розподілу, нам не вдається відхилити нульову гіпотезу. Це означає, що ми не маємо достатніх доказів, щоб стверджувати, що існує статистично значуща різниця між середніми іспитовими балами трьох груп.
Додатковий ресурс: використовуйте цей калькулятор одностороннього дисперсійного аналізу , щоб автоматично виконати односторонній дисперсійний аналіз максимум для п’яти зразків.