Двухвыборочный t-критерий: определение, формула и пример


Двухвыборочный t-критерий используется для определения того, равны ли средние значения двух совокупностей .

В этом руководстве объясняется следующее:

  • Мотивация для проведения двухвыборочного t-теста.
  • Формула для проведения двухвыборочного t-критерия.
  • Допущения, которые должны быть выполнены для проведения двухвыборочного t-критерия.
  • Пример выполнения двухвыборочного t-теста.

Двухвыборочный t-тест: мотивация

Предположим, мы хотим узнать, равен ли средний вес двух разных видов черепах. Поскольку в каждой популяции насчитываются тысячи черепах, было бы слишком долго и дорого взвешивать каждую черепаху по отдельности.

Вместо этого мы могли бы взять простую случайную выборку из 15 черепах из каждой популяции и использовать средний вес каждой выборки, чтобы определить, равен ли средний вес между двумя популяциями:

Пример двухвыборочного Т-теста

Однако практически гарантировано, что средний вес между двумя образцами будет хотя бы немного отличаться. Вопрос в том, является ли эта разница статистически значимой . К счастью, двухвыборочный t-критерий позволяет нам ответить на этот вопрос.

Двухвыборочный t-критерий: формула

Двухвыборочный t-критерий всегда использует следующую нулевую гипотезу:

  • H 0 : μ 1 = μ 2 (два средних значения совокупности равны)

Альтернативная гипотеза может быть двусторонней, левой или правой:

  • H 1 (двусторонний): μ 1 ≠ μ 2 (средние значения двух популяций не равны)
  • H 1 (слева): μ 1 < μ 2 (среднее значение популяции 1 ниже, чем среднее значение популяции 2)
  • H 1 (справа): μ 1 > μ 2 (среднее значение популяции 1 больше, чем среднее значение популяции 2)

Мы используем следующую формулу для расчета статистики t-критерия:

Статистика теста: ( x 1x 2 ) / s p (√ 1/n 1 + 1/n 2 )

где x 1 и x 2 — средние значения выборки, n 1 и n 2 — размеры выборки, и где s p рассчитывается следующим образом:

s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

где s 1 2 и s 2 2 — выборочные дисперсии.

Если значение p, соответствующее статистике t-критерия с (n 1 + n 2 -1) степенями свободы, меньше выбранного вами уровня значимости (обычные варианты — 0,10, 0,05 и 0, 01), то вы может отвергнуть нулевую гипотезу. .

Двухвыборочный t-критерий: гипотезы

Чтобы результаты двухвыборочного t-критерия были действительными, должны выполняться следующие допущения:

  • Наблюдения одной выборки должны быть независимы от наблюдений другой выборки.
  • Данные должны быть примерно нормально распределены.
  • Обе выборки должны иметь примерно одинаковую дисперсию. Если это предположение не выполняется, вместо этого следует выполнить t-критерий Уэлча .
  • Данные из обеих выборок были получены методом случайной выборки .

Двухвыборочный t-критерий : пример

Предположим, мы хотим узнать, равен ли средний вес двух разных видов черепах. Чтобы проверить это, мы проведем двухвыборочный t-критерий с уровнем значимости α = 0,05, выполнив следующие шаги:

Шаг 1. Соберите образцы данных.

Предположим, мы собираем случайную выборку черепах из каждой популяции со следующей информацией:

Образец 1:

  • Размер выборки n 1 = 40
  • Средний вес выборки x 1 = 300
  • Стандартное отклонение выборки s 1 = 18,5

Образец 2:

  • Размер выборки n 2 = 38
  • Средний вес выборки х 2 = 305
  • Стандартное отклонение выборки s 2 = 16,7

Шаг 2: Определите предположения.

Мы проведем двухвыборочный t-критерий со следующими предположениями:

  • H 0 : μ 1 = μ 2 (два средних значения совокупности равны)
  • H 1 : μ 1 ≠ μ 2 (два средних значения совокупности не равны)

Шаг 3: Рассчитайте статистику t -критерия.

Сначала мы рассчитаем объединенное стандартное отклонение s p :

s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2) = √ ( 40-1)18,5 2 + (38-1) 16,7 2 / (40+38-2) = 17,647

Далее мы рассчитаем статистику t -теста:

t = ( x 1x 2 ) / s p (√ 1/n 1 + 1/n 2 ) = (300-305) / 17,647 (√ 1/40 + 1/38 ) = -1,2508

Шаг 4: Рассчитайте p-значение статистики t- критерия.

Согласно калькулятору T Score to P Value , значение p, связанное с t = -1,2508 и степенями свободы = n 1 + n 2 -2 = 40+38-2 = 76, составляет 0,21484 .

Шаг 5: Сделайте вывод.

Поскольку это значение p не ниже нашего уровня значимости α = 0,05, мы не можем отвергнуть нулевую гипотезу. У нас нет достаточных доказательств, чтобы сказать, что средний вес черепах этих двух популяций различен.

Примечание. Вы также можете выполнить весь этот t-критерий для двух выборок, просто используя калькулятор t-критерия для двух выборок .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнить t-тест для двух выборок с использованием различных статистических программ:

Как выполнить t-тест для двух выборок в Excel
Как выполнить t-тест для двух выборок в SPSS
Как выполнить t-тест для двух выборок в Stata
Как выполнить двухвыборочный t-тест в R
Как выполнить t-тест с двумя выборками в Python
Как выполнить t-тест для двух выборок на калькуляторе TI-84

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *