Двухвыборочный t-критерий: определение, формула и пример
Двухвыборочный t-критерий используется для определения того, равны ли средние значения двух совокупностей .
В этом руководстве объясняется следующее:
- Мотивация для проведения двухвыборочного t-теста.
- Формула для проведения двухвыборочного t-критерия.
- Допущения, которые должны быть выполнены для проведения двухвыборочного t-критерия.
- Пример выполнения двухвыборочного t-теста.
Двухвыборочный t-тест: мотивация
Предположим, мы хотим узнать, равен ли средний вес двух разных видов черепах. Поскольку в каждой популяции насчитываются тысячи черепах, было бы слишком долго и дорого взвешивать каждую черепаху по отдельности.
Вместо этого мы могли бы взять простую случайную выборку из 15 черепах из каждой популяции и использовать средний вес каждой выборки, чтобы определить, равен ли средний вес между двумя популяциями:
Однако практически гарантировано, что средний вес между двумя образцами будет хотя бы немного отличаться. Вопрос в том, является ли эта разница статистически значимой . К счастью, двухвыборочный t-критерий позволяет нам ответить на этот вопрос.
Двухвыборочный t-критерий: формула
Двухвыборочный t-критерий всегда использует следующую нулевую гипотезу:
- H 0 : μ 1 = μ 2 (два средних значения совокупности равны)
Альтернативная гипотеза может быть двусторонней, левой или правой:
- H 1 (двусторонний): μ 1 ≠ μ 2 (средние значения двух популяций не равны)
- H 1 (слева): μ 1 < μ 2 (среднее значение популяции 1 ниже, чем среднее значение популяции 2)
- H 1 (справа): μ 1 > μ 2 (среднее значение популяции 1 больше, чем среднее значение популяции 2)
Мы используем следующую формулу для расчета статистики t-критерия:
Статистика теста: ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 )
где x 1 и x 2 — средние значения выборки, n 1 и n 2 — размеры выборки, и где s p рассчитывается следующим образом:
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
где s 1 2 и s 2 2 — выборочные дисперсии.
Если значение p, соответствующее статистике t-критерия с (n 1 + n 2 -1) степенями свободы, меньше выбранного вами уровня значимости (обычные варианты — 0,10, 0,05 и 0, 01), то вы может отвергнуть нулевую гипотезу. .
Двухвыборочный t-критерий: гипотезы
Чтобы результаты двухвыборочного t-критерия были действительными, должны выполняться следующие допущения:
- Наблюдения одной выборки должны быть независимы от наблюдений другой выборки.
- Данные должны быть примерно нормально распределены.
- Обе выборки должны иметь примерно одинаковую дисперсию. Если это предположение не выполняется, вместо этого следует выполнить t-критерий Уэлча .
- Данные из обеих выборок были получены методом случайной выборки .
Двухвыборочный t-критерий : пример
Предположим, мы хотим узнать, равен ли средний вес двух разных видов черепах. Чтобы проверить это, мы проведем двухвыборочный t-критерий с уровнем значимости α = 0,05, выполнив следующие шаги:
Шаг 1. Соберите образцы данных.
Предположим, мы собираем случайную выборку черепах из каждой популяции со следующей информацией:
Образец 1:
- Размер выборки n 1 = 40
- Средний вес выборки x 1 = 300
- Стандартное отклонение выборки s 1 = 18,5
Образец 2:
- Размер выборки n 2 = 38
- Средний вес выборки х 2 = 305
- Стандартное отклонение выборки s 2 = 16,7
Шаг 2: Определите предположения.
Мы проведем двухвыборочный t-критерий со следующими предположениями:
- H 0 : μ 1 = μ 2 (два средних значения совокупности равны)
- H 1 : μ 1 ≠ μ 2 (два средних значения совокупности не равны)
Шаг 3: Рассчитайте статистику t -критерия.
Сначала мы рассчитаем объединенное стандартное отклонение s p :
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2) = √ ( 40-1)18,5 2 + (38-1) 16,7 2 / (40+38-2) = 17,647
Далее мы рассчитаем статистику t -теста:
t = ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 ) = (300-305) / 17,647 (√ 1/40 + 1/38 ) = -1,2508
Шаг 4: Рассчитайте p-значение статистики t- критерия.
Согласно калькулятору T Score to P Value , значение p, связанное с t = -1,2508 и степенями свободы = n 1 + n 2 -2 = 40+38-2 = 76, составляет 0,21484 .
Шаг 5: Сделайте вывод.
Поскольку это значение p не ниже нашего уровня значимости α = 0,05, мы не можем отвергнуть нулевую гипотезу. У нас нет достаточных доказательств, чтобы сказать, что средний вес черепах этих двух популяций различен.
Примечание. Вы также можете выполнить весь этот t-критерий для двух выборок, просто используя калькулятор t-критерия для двух выборок .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнить t-тест для двух выборок с использованием различных статистических программ:
Как выполнить t-тест для двух выборок в Excel
Как выполнить t-тест для двух выборок в SPSS
Как выполнить t-тест для двух выборок в Stata
Как выполнить двухвыборочный t-тест в R
Как выполнить t-тест с двумя выборками в Python
Как выполнить t-тест для двух выборок на калькуляторе TI-84