Как посчитать сумму квадратов в anova (с примером)


В статистике однофакторный дисперсионный анализ используется для сравнения средних значений трех или более независимых групп, чтобы определить, существует ли статистически значимая разница между средними значениями соответствующей совокупности.

Всякий раз, когда вы выполняете однофакторный дисперсионный анализ, вы всегда вычисляете три значения суммы квадратов:

1. Регрессия суммы квадратов (SSR)

2. Ошибка суммы квадратов (SSE).

  • Это сумма квадратов разностей между каждым отдельным наблюдением и групповым средним значением этого наблюдения.

3. Сумма общих квадратов (SST)

  • Это сумма квадратов различий между каждым отдельным наблюдением и общим средним значением.

Каждое из этих трех значений помещается в итоговую таблицу ANOVA, которую мы используем, чтобы определить, существует ли статистически значимая разница между групповыми средними.

В следующем примере показано, как на практике вычислить каждое из этих значений суммы квадратов для однофакторного дисперсионного анализа.

Пример: Как вычислить сумму квадратов в ANOVA

Предположим, мы хотим знать, приводят ли три разные программы подготовки к экзамену к разным средним баллам на данном экзамене. Чтобы проверить это, мы набираем 30 студентов для участия в исследовании и делим их на три группы.

Студентам в каждой группе случайным образом назначаются использовать одну из трех программ подготовки к экзамену в течение следующих трех недель для подготовки к экзамену. В конце трех недель все студенты сдают один и тот же экзамен.

Результаты экзамена для каждой группы показаны ниже:

Пример односторонних данных ANOVA

Следующие шаги показывают, как вычислить сумму значений квадратов для этого однофакторного дисперсионного анализа.

Шаг 1: Рассчитайте среднее значение группы и общее среднее значение.

Сначала мы рассчитаем среднее значение трех групп, а также общее (или «общее») среднее значение:

Шаг 2: Рассчитайте SSR.

Далее мы рассчитаем регрессию суммы квадратов (SSR), используя следующую формулу:

nΣ(X jX ..) 2

Золото:

  • n : размер выборки группы j
  • Σ : греческий символ, означающий «сумма».
  • X j : среднее значение группы j
  • X .. : общий средний показатель

В нашем примере мы вычисляем, что SSR = 10(83,4-85,8) 2 + 10(89,3-85,8) 2 + 10(84,7-85,8) 2 = 192,2.

Шаг 3: Рассчитайте SES.

Далее мы рассчитаем сумму ошибок суммы квадратов (SSE) по следующей формуле:

Σ(X ijX j ) 2

Золото:

  • Σ : греческий символ, означающий «сумма».
  • X ij : i-е наблюдение группы j
  • X j : среднее значение группы j

В нашем примере мы рассчитываем SSE следующим образом:

Группа 1: (85-83,4) 2 + (86-83,4) 2 +   (88-83,4) 2 +   (75-83,4) 2 +   (78-83,4) 2 +   (94-83,4) 2 +   (98-83,4) 2 +   (79-83,4) 2 +   (71-83,4) 2 +   (80-83,4) 2 = 640,4

Группа 2: (91-89,3) 2 + (92-89,3) 2 +   (93-89,3) 2 +   (85-89,3) 2 +   (87-89,3) 2 +   (84-89,3) 2 +   (82-89,3) 2 +   (88-89,3) 2 +   (95-89,3) 2 +   (96-89,3) 2 = 208,1

Группа 3: (79-84,7) 2 + (78-84,7) 2 +   (88-84,7) 2 +   (94-84,7) 2 +   (92-84,7) 2 +   (85-84,7) 2 +   (83-84,7) 2 +   (85-84,7) 2 +   (82-84,7) 2 +   (81-84,7) 2 = 252,1

ЭСС: 640,4 + 208,1 + 252,1 = 1100,6

Шаг 4: Рассчитайте SST.

Далее рассчитаем общую сумму квадратов (SST) по следующей формуле:

ССТ = ССР + ССЕ

В нашем примере ССТ = 192,2 + 1100,6 = 1292,8.

После того, как мы рассчитали значения SSR, SSE и SST, каждое из этих значений будет окончательно помещено в таблицу ANOVA:

Источник Сумма квадратов (СС) дф Среднеквадратичные (МС) F-значение p-значение
Регрессия 192,2 2 96,1 2358 0,1138
Ошибка 1100,6 27 40,8
Общий 1292,8 29

Вот как мы рассчитали разные числа в таблице:

  • регрессия df: k-1 = 3-1 = 2
  • ошибка df: nk = 30-3 = 27
  • общая df: n-1 = 30-1 = 29
  • Лечение СЭП: лечение ССТ/df = 192,2/2 = 96,1
  • Ошибка MS: ошибка SSE / df = 1100,6 / 27 = 40,8
  • Значение F: обработка MS/ошибка MS = 96,1/40,8 = 2,358
  • p-значение : p-значение, соответствующее значению F.

Примечание: n = общее количество наблюдений, k = количество групп.

Ознакомьтесь с этим руководством , чтобы узнать, как интерпретировать значение F и значение p в таблице ANOVA.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *