Как рассчитать среднее значение в anova (с примером)


В статистике однофакторный дисперсионный анализ используется для сравнения средних значений трех или более независимых групп, чтобы определить, существует ли статистически значимая разница между средними значениями соответствующей совокупности.

Одна метрика, которую мы всегда рассчитываем при использовании ANOVA, — это среднее значение , которое представляет собой среднее значение всех наблюдений в наборе данных.

Он рассчитывается следующим образом:

Общая авария = Σx i / n

Золото:

  • x i : i наблюдение в наборе данных.
  • n : общее количество наблюдений в наборе данных.

Общее среднее важно, поскольку оно используется в формуле для расчета общей суммы квадратов, которая является важным значением, которое попадает в окончательную таблицу ANOVA.

В следующем примере показано, как на практике вычислить общее среднее дисперсионного анализа.

Пример: расчет общего среднего значения в ANOVA

Предположим, мы хотим знать, приводят ли три разные программы подготовки к экзамену к разным средним баллам на данном экзамене. Чтобы проверить это, мы набираем 30 студентов для участия в исследовании и делим их на три группы.

Студентам в каждой группе случайным образом назначаются использовать одну из трех программ подготовки к экзамену в течение одного месяца для подготовки к экзамену. В конце месяца все студенты сдают один и тот же экзамен.

Результаты экзамена для каждой группы показаны ниже:

Пример односторонних данных ANOVA

Чтобы вычислить общее среднее значение этого набора данных, мы просто суммируем все наблюдения, а затем делим на общее количество наблюдений:

Общий средний балл: (85 + 86 + 88 + 75 + 78 + 94 + 98 + 79 + 71 + 80 + 91 + 92 + 93 + 85 + 87 + 84 + 82 + 88 + 95 + 96 + 79 + 78 + 88 + 94+92+85+83+85+82+81)/30= 85,8 .

Общий средний балл составляет 85,8. Это представляет собой средний балл экзамена 30 студентов.

Обратите внимание, что это значение не обязательно будет соответствовать средним показателям по отдельной группе.

Например, если мы рассчитаем среднее значение для каждой группы студентов, мы обнаружим, что ни одно среднее значение по группе на самом деле не соответствует общему среднему (или «общему» среднему):

Это общее среднее затем используется в формуле для расчета общей суммы квадратов , которая рассчитывается как сумма квадратов отклонений между каждым отдельным наблюдением и общим средним значением:

Общая сумма квадратов: (85 – 85,8) 2 + (86 – 85,8) 2 + (88 – 85,8) 2 + . . . + (82 – 85,8) 2 + (81 – 85,8) 2 = 1292,8 .

Это значение затем дополнительно используется в итоговой таблице ANOVA:

Источник Сумма квадратов (СС) дф Среднеквадратичные (МС) Ф
Уход 192,2 2 96,1 2358
Ошибка 1100,6 27 40,8
Общий 1292,8 29

Связанный: Как интерпретировать F-значение и P-значение в ANOVA

Хорошей новостью является то, что вам редко придется вручную рассчитывать среднее значение ANOVA, поскольку большинство статистических программ могут сделать это за вас.

Однако полезно знать, как рассчитывается общее среднее и как оно фактически используется в таблице ANOVA.

Дополнительные ресурсы

В следующих руководствах объясняется, как на практике выполнить однофакторный дисперсионный анализ:

Как вручную выполнить однофакторный дисперсионный анализ
Как выполнить однофакторный дисперсионный анализ в Excel
Как выполнить односторонний дисперсионный анализ в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *