Внутрішньогрупові або міжгрупові варіації в anova


Односторонній дисперсійний аналіз ANOVA використовується для визначення того, чи рівні середні три чи більше незалежних груп.

Односторонній ANOVA використовує такі нульові та альтернативні гіпотези :

  • H 0 : Усі групові середні рівні.
  • H A : Принаймні одне групове середнє значення відрізняється від інших.

Кожного разу, коли ви виконуєте односторонній дисперсійний аналіз, ви отримаєте зведену таблицю, яка виглядає так:

Ми бачимо, що дисперсійний аналіз вимірює два різних джерела варіації:

Варіація між групами : загальна варіація між середнім значенням кожної групи та загальним середнім.

Внутрішньогрупова варіація : загальна варіація індивідуальних значень у кожній групі та їхнє групове середнє значення.

Якщо варіація між групами є високою відносно варіації всередині групи, то F-статистика дисперсійного аналізу буде вищою, а відповідне значення p – нижчим, що підвищує ймовірність того, що нульову гіпотезу буде відхилено, згідно з якою групові середні рівні.

У наступному прикладі показано, як на практиці обчислити варіацію між групами та варіацію всередині групи для одностороннього дисперсійного аналізу.

Приклад: обчислення варіації всередині групи та між групами в ANOVA

Припустімо, ми хочемо визначити, чи призводять три різні методи навчання до різних середніх балів за іспит. Щоб перевірити це, ми набираємо 30 студентів і випадковим чином призначаємо по 10 для використання іншого методу навчання.

Результати іспитів студентів у кожній групі наведені нижче:

Ми можемо використати наступну формулу для розрахунку варіації між групами :

Варіація між групами = Σn j (X jX ..) 2

золото:

  • n j : розмір вибірки групи j
  • Σ : символ, що означає «сума»
  • X j : середнє значення групи j
  • X .. : загальне середнє

Щоб обчислити це значення, ми спочатку обчислимо середнє для кожної групи та загальне середнє:

Потім ми обчислюємо варіацію між групами таким чином: 10(80,5-83,1) 2 + 10(82,1-83,1) 2 + 10(86,7-83,1) 2 = 207,2 .

Тоді ми можемо використати наступну формулу для розрахунку варіації всередині групи :

Внутрішньогрупова варіація : Σ(X ijX j ) 2

золото:

  • Σ : символ, що означає «сума»
  • X ij : i-те спостереження групи j
  • X j : середнє значення групи j

У нашому прикладі ми обчислюємо варіацію всередині групи як:

1 група: (75-80,5) 2 + (77-80,5) 2 +   (78-80,5) 2 +   (78-80,5) 2 +   (79-80,5) 2 +   (81-80,5) 2 +   (81-80,5) 2 +   (83-80,5) 2 +   (86-80,5) 2 +   (87-80,5) 2 = 136,5

2 група: (78-82,1) 2 + (78-82,1) 2 +   (79-82,1) 2 +   (81-82,1) 2 +   (81-82,1) 2 +   (82-82,1) 2 +   (83-82,1) 2 +   (85-82,1) 2 +   (86-82,1) 2 +   (88-82,1) 2 = 104,9

3 група: (82-86,7) 2 + (82-86,7) 2 +   (84-86,7) 2 +   (86-86,7) 2 +   (86-86,7) 2 +   (87-86,7) 2 +   (87-86,7) 2 +   (89-86,7) 2 +   (90-86,7) 2 +   (94-86,7) 2 = 122,1

Варіація всередині групи: 136,5 + 104,9 + 122,1 = 363,5

Якщо ми використовуємо статистичне програмне забезпечення для виконання одностороннього дисперсійного аналізу за допомогою цього набору даних, ми отримаємо таку таблицю дисперсійного аналізу:

Зверніть увагу, що міжгрупові та внутрішньогрупові значення варіації збігаються з тими, які ми розрахували вручну.

Загальна F-статистика в таблиці є способом кількісної оцінки зв’язку між варіаціями між групами та варіаціями всередині групи.

Чим більша статистика F, тим більша варіація середніх значень між групами порівняно з варіацією всередині груп.

Отже, чим більше F-статистика, тим очевидніше, що існує різниця між груповими середніми.

У цьому прикладі ми бачимо, що p-значення, яке відповідає F-статистиці 7,6952, становить 0,0023 .

Оскільки це значення менше α = 0,05, ми відхиляємо нульову гіпотезу дисперсійного аналізу та робимо висновок, що три методи дослідження не призводять до однакових балів на іспиті.

Додаткові ресурси

У наступних посібниках надається додаткова інформація про моделі ANOVA:

Вступ до одностороннього дисперсійного аналізу
Як інтерпретувати значення F і P у ANOVA
Повний посібник: як звітувати про результати ANOVA

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *