В чем разница между т-тестом и anova?
В этом руководстве объясняется разница между t-тестом и ANOVA , а также когда использовать каждый тест.
Т-тест
Стьюдент-критерий используется для определения наличия или отсутствия статистически значимой разницы между средними значениями двух групп . Существует два типа t-тестов:
1. Независимые выборки t-критерия. Это используется, когда мы хотим сравнить разницу между средними значениями двух групп, и группы полностью независимы друг от друга.
Например, исследователи могут захотеть узнать, помогает ли диета А или диета Б людям сбросить больше веса. 100 случайным образом назначенным людям была назначена диета А. Еще 100 случайно выбранным людям назначена диета Б. Через три месяца исследователи фиксируют общую потерю веса каждого человека. Чтобы определить, существенно ли отличается средняя потеря веса между двумя группами, исследователи могут провести t-критерий независимых выборок.
2. Парные выборки t-критерия . Это используется, когда мы хотим сравнить разницу между средними значениями двух групп и когда каждое наблюдение из одной группы может быть связано с наблюдением из другой группы.
Например, предположим, что 20 учеников в классе сдают тест, затем изучают определенное руководство, а затем снова сдают тест. Чтобы сравнить разницу между результатами первого и второго теста, мы используем парный t-критерий, поскольку для каждого учащегося его результат по первому тесту может быть связан с его результатом по второму тесту.
Чтобы t-критерий дал достоверные результаты, должны быть выполнены следующие допущения:
- Случайный выбор: для сбора данных для обеих выборок следует использовать случайную выборку или случайный эксперимент.
- Нормальное: Распределение выборки нормальное или приблизительно нормальное.
Если эти предположения выполняются, то можно использовать t-критерий для проверки разницы между средними значениями двух групп.
дисперсионный анализ
ANOVA (дисперсионный анализ) используется для определения наличия или отсутствия статистически значимой разницы между средними значениями трех или более групп . Наиболее часто используемые на практике тесты ANOVA — это однофакторный и двусторонний дисперсионный анализ:
Однофакторный дисперсионный анализ: используется для проверки наличия или отсутствия статистически значимой разницы между средними значениями трех или более групп, когда группы можно разделить по одному фактору .
Пример: вы случайным образом делите класс из 90 учеников на три группы по 30 человек. Каждая группа в течение месяца использует разные методы обучения для подготовки к экзамену. В конце месяца все студенты сдают один и тот же экзамен. Вы хотите знать, влияет ли техника обучения на результаты экзаменов. Итак, вы выполняете однофакторный дисперсионный анализ, чтобы определить, существует ли статистически значимая разница между средними баллами трех групп.
Двусторонний дисперсионный анализ: используется для проверки наличия или отсутствия статистически значимой разницы между средними значениями трех или более групп, когда группы можно разделить по двум факторам .
Пример: вы хотите определить, влияет ли уровень физических упражнений (отсутствие физических упражнений, легкие упражнения, энергичные упражнения) и пол (мужской, женский) на потерю веса. В данном случае вы изучаете два фактора — физические упражнения и пол, а переменной ответа — потерю веса (измеряется в фунтах). Вы можете выполнить двусторонний дисперсионный анализ, чтобы определить, влияют ли физические упражнения и пол на потерю веса, а также определить, существует ли взаимодействие между физическими упражнениями и полом на потерю веса.
Чтобы дисперсионный анализ дал достоверные результаты, должны быть выполнены следующие предположения:
- Нормальность – все популяции, которые мы изучаем, имеют нормальное распределение. Так, например, если мы хотим сравнить экзаменационные баллы трех разных групп студентов, экзаменационные баллы первой группы, второй группы и третьей группы должны быть распределены нормально.
- Равная дисперсия – дисперсии генеральной совокупности в каждой группе равны или примерно равны.
- Независимость – наблюдения каждой группы должны быть независимы друг от друга. Обычно об этом заботится рандомизированный дизайн .
Если эти предположения выполняются, то можно использовать дисперсионный анализ для проверки разницы между средними значениями трех или более групп.
Поймите различия между каждым тестом
Основное различие между t-тестом и дисперсионным анализом заключается в том, как оба теста рассчитывают свою тестовую статистику, чтобы определить, существует ли статистически значимая разница между группами.
В t-критерии независимых выборок используется следующая статистика теста:
статистика теста t = [ ( x 1 – x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )
где x 1 и x 2 — выборочные средние для групп 1 и 2, d — гипотетическая разница между двумя средними значениями (часто равна нулю), s 1 2 и s 2 2 — выборочные дисперсии для групп 1 и 2, и n 1 и n 2 — размеры выборки для групп 1 и 2 соответственно.
T-критерий для парных выборок использует следующую статистику теста:
статистика теста t = d / (s d / √n)
где d — средняя разница между двумя группами, s d — стандартное отклонение различий, а n — размер выборки для каждой группы (обратите внимание, что обе группы будут иметь одинаковый размер выборки).
ANOVA использует следующую статистику теста:
статистика теста F = s 2 b / s 2 w
где s 2 b — межвыборочная дисперсия, а s 2 w — внутривыборочная дисперсия.
Стьюдент-тест измеряет отношение средней разницы между двумя группами к общему стандартному отклонению различий. Если это соотношение достаточно велико, это является достаточным свидетельством того, что между двумя группами существует значительная разница.
С другой стороны, дисперсионный анализ измеряет соотношение дисперсии между группами по сравнению с дисперсией внутри групп. Как и в случае с t-тестом, если это соотношение достаточно велико, оно дает достаточно доказательств того, что все три группы имеют разные средние значения.
Еще одно ключевое различие между t-тестом и ANOVA заключается в том, что t-критерий может сказать нам, имеют ли две группы одинаковое среднее значение. С другой стороны, дисперсионный анализ говорит нам, имеют ли все три группы одинаковое среднее значение, но он не говорит нам явно , какие группы имеют разные средние значения друг от друга.
Чтобы выяснить, какие группы отличаются друг от друга, необходимо провести апостериорное тестирование .
Поймите, когда использовать каждый тест
На практике, когда мы хотим сравнить средние значения двух групп , мы используем t-критерий. Когда мы хотим сравнить средние значения трех или более групп , мы используем ANOVA.
Основная причина, по которой мы не просто используем несколько t-тестов для сравнения средних значений трех или более групп, связана с пониманием частоты ошибок первого рода. Предположим, мы хотим сравнить средние значения трех групп: группы A, группы B и группы C. У вас может возникнуть соблазн выполнить следующие три t-теста:
- Тест A t для сравнения разницы средних значений между группой A и группой B.
- Тест A для сравнения разницы средних значений между группой A и группой C.
- Тест A t для сравнения разницы средних значений между группой B и группой C.
Для каждого t-теста существует вероятность того, что мы допустим ошибку I рода , то есть вероятность того, что мы отвергнем нулевую гипотезу, хотя она на самом деле верна. Эта вероятность обычно составляет 5%. Это означает, что когда мы выполняем несколько t-тестов, частота ошибок увеличивается. Например:
- Вероятность того, что мы допустим ошибку I рода с помощью одного t-теста, равна 1 – 0,95 = 0,05 .
- Вероятность того, что мы допустим ошибку I рода с двумя t-тестами, равна 1 – (0,95 2 ) = 0,0975 .
- Вероятность того, что мы допустим ошибку I рода с двумя t-тестами, равна 1 – (0,95 3 ) = 0,1427 .
Этот процент ошибок неприемлемо высок. К счастью, дисперсионный анализ учитывает эти ошибки, так что ошибка типа I остается на уровне всего 5%. Это позволяет нам быть более уверенными в том, что статистически значимый результат теста действительно значим, а не просто результат, который мы получили в результате проведения множества тестов.
Итак, когда мы хотим понять, существует ли разница между средними значениями трех или более групп, нам нужно использовать дисперсионный анализ, чтобы наши результаты были статистически достоверными и надежными.