Приближение саттертуэйта: определение и пример


Приближение Саттертуэйта — это формула, используемая для определения «эффективных степеней свободы» в двухвыборочном t-тесте.

Чаще всего он используется в t-критерии Уэлча , который сравнивает средние значения двух независимых выборок без предположения, что популяции, из которых взяты выборки, имеют равные дисперсии.

Формула приближения Саттертуэйта выглядит следующим образом:

 Degrees of freedom: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / {[(s 1 2 /n 1 ) 2 /(n 1 – 1)] + [(s 2 2 /n 2 ) 2 /(n 2 – 1)]}

Золото:

  • s 1 2 , s 2 2 : Выборочная дисперсия первой и второй выборок соответственно.
  • n1 , n2 : размер первой и второй выборок соответственно.

В следующем примере показано, как использовать приближение Саттертуэйта для расчета эффективных степеней свободы.

Пример: расчет приближения Саттертуэйта

Предположим, мы хотим знать, одинакова ли средняя высота двух разных видов растений. Поэтому мы соберем две простые случайные выборки каждого вида и измерим высоту растений в каждой выборке.

Следующие значения указывают высоту (в дюймах) каждого образца:

Образец 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25.

Образец 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34.

Средние значения, дисперсии и размеры выборки оказываются следующими:

  • х1 = 19,27
  • х2 = 23,69
  • с 1 2 = 20,42
  • с 2 2 = 83,23
  • п1 = 11
  • п2 = 13

Затем мы можем подставить значения дисперсий и размеров выборки в формулу аппроксимации Саттертуэйта, чтобы найти эффективные степени свободы:

 df = (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / {[(s 1 2 /n 1 ) 2 /(n 1 – 1)] + [(s 2 2 /n 2 ) 2 / (n 2 – 1)]} 

df = (20.42/11 + 83.23/13) 2 /{[(20.42/11) 2 /(11 – 1)] + [(83.23/13) 2 /(13 – 1)]} = 18.137

Эффективные степени свободы оказываются равными 18 137 .

Обычно мы округляем это значение до ближайшего целого числа, поэтому степени свободы, которые мы будем использовать в нашем t-критерии Уэлча, равны 18 .

Наконец, мы найдем критическое значение t в таблице распределения t, которое соответствует двустороннему тесту с альфа = 0,05 для 18 степеней свободы:

Таблица распределения Т

Критическое значение t равно 2,101 .

Затем мы рассчитаем нашу тестовую статистику следующим образом:

Статистика теста: ( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

Статистика теста: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538

Поскольку абсолютное значение нашей тестовой статистики (1,538) не превышает критического значения t, мы не можем отвергнуть нулевую гипотезу теста.

Недостаточно доказательств, чтобы утверждать, что средства двух групп населения существенно различаются.

Приближение Саттертуэйта на практике

На практике вам редко придется вычислять приближение Саттертуэйта вручную.

Вместо этого обычное статистическое программное обеспечение, такое как R, Python, Excel, SAS и Stata, может использовать аппроксимацию Саттертуэйта для автоматического расчета эффективных степеней свободы.

Дополнительные ресурсы

Введение в проверку гипотез
Введение в двухвыборочный t-критерий
Введение в t-критерий Уэлча

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *