Наближення саттертуейта: визначення та приклад
Наближення Саттертуейта — це формула, яка використовується для знаходження «ефективних ступенів свободи» у двовибірковому t-критерії.
Він найчастіше використовується в t-критерії Велча , який порівнює середні значення двох незалежних вибірок, не припускаючи, що популяції, з яких взято вибірки , мають однакові дисперсії.
Формула для апроксимації Саттертуейта виглядає наступним чином:
Degrees of freedom: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / {[(s 1 2 /n 1 ) 2 /(n 1 – 1)] + [(s 2 2 /n 2 ) 2 /(n 2 – 1)]}
золото:
- s 1 2 , s 2 2 : вибіркова дисперсія першої та другої вибірок відповідно.
- n1 , n2 : розмір вибірки для першої та другої вибірок відповідно.
У наступному прикладі показано, як використовувати наближення Саттертуейта для обчислення ефективних ступенів свободи.
Приклад: Розрахунок апроксимації Саттертуейта
Припустімо, ми хочемо знати, чи однакова середня висота двох різних видів рослин. Отже, ми зберемо два простих випадкових зразки кожного виду та виміряємо висоту рослин у кожному зразку.
Наступні значення вказують на висоту (в дюймах) кожного зразка:
Зразок 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25
Зразок 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34
Середні значення, дисперсії та розміри вибірки виявляються такими:
- х1 = 19,27
- х2 = 23,69
- s 1 2 = 20,42
- s 2 2 = 83,23
- n1 = 11
- n2 = 13
Потім ми можемо підключити значення дисперсій і розміри вибірки до формули апроксимації Саттертуейта, щоб знайти ефективні ступені свободи:
df = (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / {[(s 1 2 /n 1 ) 2 /(n 1 – 1)] + [(s 2 2 /n 2 ) 2 / (n 2 – 1)]}
df = (20.42/11 + 83.23/13) 2 /{[(20.42/11) 2 /(11 – 1)] + [(83.23/13) 2 /(13 – 1)]} = 18.137
Ефективні ступені свободи виявляються рівними 18 137 .
Як правило, ми округлюємо це значення до найближчого цілого числа, тому ступені свободи, які ми б використали в нашому t-критерії Велча, дорівнюють 18 .
Нарешті, ми знайдемо критичне значення t у таблиці розподілу t, яке відповідає двобічному тесту з альфа = 0,05 для 18 ступенів свободи:
Критичне значення t становить 2,101 .
Потім ми обчислюємо нашу тестову статистику наступним чином:
Статистика тесту: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Статистика тесту: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538
Оскільки абсолютне значення нашої тестової статистики (1,538) не перевищує критичне значення t, ми не можемо відхилити нульову гіпотезу тесту.
Немає достатньо доказів, щоб стверджувати, що засоби двох популяцій істотно відрізняються.
Наближення Саттертуейта на практиці
На практиці вам рідко доведеться обчислювати наближення Саттертуейта вручну.
Натомість звичайні статистичні програми, такі як R, Python, Excel, SAS і Stata, можуть використовувати наближення Саттертуейта для автоматичного розрахунку ефективних ступенів свободи для вас.
Додаткові ресурси
Вступ до перевірки гіпотез
Вступ до двовибіркового t-тесту
Вступ до t-критерію Велча