Внутригрупповые или межгрупповые вариации в anova


Однофакторный дисперсионный анализ используется для определения того, равны ли средние значения трех или более независимых групп.

Однофакторный дисперсионный анализ использует следующие нулевые и альтернативные гипотезы :

  • H 0 : Все средние значения группы равны.
  • Х А : По крайней мере, одно среднее значение группы отличается от других.

Каждый раз, когда вы выполняете однофакторный дисперсионный анализ, вы получаете сводную таблицу, которая выглядит следующим образом:

Мы видим, что существует два разных источника вариаций, которые измеряет ANOVA:

Разница между группами : общая разница между средним значением каждой группы и общим средним значением.

Внутригрупповая вариация : общая вариация индивидуальных значений в каждой группе и их среднее по группе.

Если различия между группами высоки по сравнению с различиями внутри группы, то статистика F дисперсионного анализа будет выше, а соответствующее значение p будет ниже, что повышает вероятность отклонения нулевой гипотезы, согласно которой групповые средства равны.

В следующем примере показано, как на практике рассчитать вариацию между группами и внутри группы для однофакторного дисперсионного анализа.

Пример: расчет вариации внутри группы и между группами в ANOVA

Предположим, мы хотим определить, приводят ли три разных метода обучения к разным средним баллам на экзамене. Чтобы проверить это, мы набираем 30 студентов и случайным образом распределяем по 10 каждому, чтобы они использовали разные методы обучения.

Результаты экзаменов студентов каждой группы представлены ниже:

Мы можем использовать следующую формулу для расчета разницы между группами :

Разница между группами = Σn j (X jX ..) 2

Золото:

  • n j : размер выборки группы j
  • Σ : символ, означающий «сумма».
  • X j : среднее значение группы j
  • X .. : общий средний показатель

Чтобы рассчитать это значение, мы сначала рассчитаем среднее значение каждой группы и общее среднее значение:

Затем мы вычисляем разницу между группами следующим образом: 10(80,5-83,1) 2 + 10(82,1-83,1) 2 + 10(86,7-83,1) 2 = 207,2 .

Затем мы можем использовать следующую формулу для расчета вариации внутри группы :

Внутригрупповая вариация : Σ(X ijX j ) 2

Золото:

  • Σ : символ, означающий «сумма».
  • X ij : i-е наблюдение группы j
  • X j : среднее значение группы j

В нашем примере мы рассчитываем вариацию внутри группы как:

1-я группа: (75-80,5) 2 + (77-80,5) 2 +   (78-80,5) 2 +   (78-80,5) 2 +   (79-80,5) 2 +   (81-80,5) 2 +   (81-80,5) 2 +   (83-80,5) 2 +   (86-80,5) 2 +   (87-80,5) 2 = 136,5

Группа 2: (78-82,1) 2 + (78-82,1) 2 +   (79-82,1) 2 +   (81-82,1) 2 +   (81-82,1) 2 +   (82-82,1) 2 +   (83-82,1) 2 +   (85-82,1) 2 +   (86-82,1) 2 +   (88-82,1) 2 = 104,9

Группа 3: (82-86,7) 2 + (82-86,7) 2 +   (84-86,7) 2 +   (86-86,7) 2 +   (86-86,7) 2 +   (87-86,7) 2 +   (87-86,7) 2 +   (89-86,7) 2 +   (90-86,7) 2 +   (94-86,7) 2 = 122,1

Разброс внутри группы: 136,5 + 104,9 + 122,1 = 363,5.

Если мы используем статистическое программное обеспечение для выполнения однофакторного дисперсионного анализа с использованием этого набора данных, мы получим следующую таблицу дисперсионного анализа:

Обратите внимание, что значения вариаций между группами и внутри группы совпадают с теми, которые мы рассчитали вручную.

Общая статистика F в таблице — это способ количественной оценки взаимосвязи между вариациями между группами и вариациями внутри группы.

Чем больше статистика F, тем больше средние различия между группами по сравнению с различиями внутри групп.

Таким образом, чем больше статистика F, тем очевиднее существует разница между групповыми средними.

В этом примере мы видим, что значение p, соответствующее F-статистике 7,6952, равно 0,0023 .

Поскольку это значение меньше α = 0,05, мы отвергаем нулевую гипотезу ANOVA и приходим к выводу, что три метода исследования не приводят к одинаковому результату на экзамене.

Дополнительные ресурсы

В следующих руководствах представлена дополнительная информация о моделях ANOVA:

Введение в однофакторный дисперсионный анализ
Как интерпретировать значение F и значение P в ANOVA
Полное руководство: Как сообщить о результатах ANOVA

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *