Як обчислити велике середнє в anova (з прикладом)


У статистиці односторонній дисперсійний аналіз використовується для порівняння середніх значень трьох або більше незалежних груп, щоб визначити, чи існує статистично значуща різниця між середніми значеннями відповідної сукупності.

Одним із показників, який ми завжди обчислюємо, використовуючи дисперсійний аналіз, є велике середнє , яке представляє середнє значення всіх спостережень у наборі даних.

Він розраховується таким чином:

Загальна аварія = Σx i / n

золото:

  • x i : i -те спостереження в наборі даних
  • n : загальна кількість спостережень у наборі даних

Велике середнє важливе, оскільки воно використовується у формулі для обчислення загальної суми квадратів, що є важливим значенням, яке потрапляє в остаточну таблицю ANOVA.

У наступному прикладі показано, як на практиці обчислити велике середнє ANOVA.

Приклад: Розрахунок загальної середньої в ANOVA

Припустімо, ми хочемо знати, чи три різні програми підготовки до іспиту призводять до різних середніх балів на даному іспиті. Щоб перевірити це, ми набираємо 30 студентів для участі в дослідженні та ділимо їх на три групи.

Студенти в кожній групі випадковим чином розподіляються для використання однієї з трьох програм підготовки до іспиту протягом одного місяця для підготовки до іспиту. Наприкінці місяця всі учні складають однаковий іспит.

Результати іспитів для кожної групи наведені нижче:

Приклад односторонніх даних ANOVA

Щоб обчислити загальне середнє значення цього набору даних, ми просто додаємо всі спостереження, а потім розділимо на загальну кількість спостережень:

Загальний середній показник: (85 + 86 + 88 + 75 + 78 + 94 + 98 + 79 + 71 + 80 + 91 + 92 + 93 + 85 + 87 + 84 + 82 + 88 + 95 + 96 + 79 + 78 + 88 + 94 + 92 + 85 + 83 + 85 + 82 + 81) / 30 = 85,8 .

Загальний середній бал 85,8. Це середній іспитовий бал 30 студентів.

Зауважте, що це значення не обов’язково відповідатиме середнім значенням для окремих груп.

Наприклад, якщо ми обчислимо середнє значення для кожної групи студентів, ми виявимо, що жодне групове середнє фактично не відповідає загальному середньому (або «загальному» середньому):

Потім це велике середнє використовується у формулі для обчислення загальної суми квадратів , яка обчислюється як сума квадратів відхилень між кожним окремим спостереженням і великим середнім:

Загальна сума квадратів: (85 – 85,8) 2 + (86 – 85,8) 2 + (88 – 85,8) 2 + . . . + (82 – 85,8) 2 + (81 – 85,8) 2 = 1292,8 .

Потім це значення необов’язково використовується в остаточній таблиці ANOVA:

Джерело Сума квадратів (SS) df Середні квадрати (MS) Ф
Лікування 192.2 2 96.1 2,358
Помилка 1100,6 27 40.8
Всього 1292,8 29

Пов’язане: Як інтерпретувати F-значення та P-значення в ANOVA

Хороша новина полягає в тому, що вам рідко доведеться вручну обчислювати велике середнє ANOVA, оскільки більшість статистичних програм можуть зробити це за вас.

Однак корисно знати, як розраховується велике середнє і як воно фактично використовується в таблиці ANOVA.

Додаткові ресурси

У наступних посібниках пояснюється, як на практиці виконати односторонній дисперсійний аналіз:

Як вручну виконати односторонній дисперсійний аналіз
Як виконати односторонній дисперсійний аналіз в Excel
Як виконати односторонній дисперсійний аналіз у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *