Т-тест велча: коли його використовувати + приклади
Коли ми хочемо порівняти середні значення двох незалежних груп, ми можемо вибрати між використанням двох різних тестів:
Т-критерій Стьюдента: цей тест припускає, що дві групи даних відібрано з сукупностей, які дотримуються нормального розподілу , і що дві сукупності мають однакову дисперсію.
Т-критерій Велча: цей тест припускає, що обидві групи даних відібрано з сукупностей, які дотримуються нормального розподілу, але не передбачає, що ці дві сукупності мають однакову дисперсію .
Різниця між t-критерієм Стьюдента та t-критерієм Уелча
Існує дві відмінності в тому, як виконуються t-критерій Стьюдента та t-критерій Велча:
- Статистика тесту
- Ступені свободи
Т-критерій Стьюдента:
Статистика тесту: ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 )
де x 1 і x 2 — середні значення вибірки, n 1 і n 2 — розміри вибірки для вибірки 1 і вибірки 2 відповідно, і де s p обчислюється наступним чином:
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
де s 1 2 і s 2 2 – вибіркові дисперсії.
Ступені свободи: n 1 + n 2 – 2
Т-критерій Велча
Статистика тесту: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Ступені свободи: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
Формула для обчислення ступенів свободи для t-критерію Велча враховує різницю між двома стандартними відхиленнями. Якщо два зразки мають однакові стандартні відхилення, то ступені свободи t-критерію Велча будуть точно такими ж, як і ступені свободи t-критерію Стьюдента.
Як правило, стандартні відхилення для двох зразків не однакові, тому ступені свободи t-критерію Велча мають тенденцію бути меншими, ніж ступені свободи t-критерію Стьюдента.
Також важливо відзначити, що ступені свободи в t-критерії Велча, як правило, не є цілим числом. Якщо ви тестуєте вручну, найкраще округлити до найменшого цілого числа. Якщо ви використовуєте статистичне програмне забезпечення, наприклад R , програмне забезпечення зможе надати десяткове значення ступенів свободи.
Коли слід використовувати t-критерій Велча?
Деякі люди стверджують, що t-критерій Велча має бути вибором за замовчуванням для порівняння середніх значень двох незалежних груп, оскільки він працює краще, ніж t-критерій Стьюдента, коли розміри вибірки та дисперсії між групами неоднакові, і дає ідентичні результати, коли розміри вибірки різні. різниці рівні.
На практиці, коли ви порівнюєте середні значення двох груп, малоймовірно, що стандартні відхилення кожної групи будуть однаковими. Тому доцільно завжди використовувати t-критерій Велча, щоб вам не доводилося робити припущення щодо рівності дисперсій.
Приклади використання t-критерію Велча
Далі ми виконаємо t-критерій Велча на наступних двох вибірках, щоб визначити, чи відрізняються середні значення сукупності суттєво на рівні значущості 0,05:
Зразок 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25
Зразок 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34
Ми проілюструємо, як виконати тест трьома різними способами:
- За руку
- Використовуйте Microsoft Excel
- Використовуйте статистичну мову програмування R
Т-тест Велча вручну
Щоб виконати t-критерій Велча вручну, нам спочатку потрібно знайти вибіркові середні значення, вибіркові дисперсії та розміри вибірки:
х1 – 19,27
х2 – 23,69
s 1 2 – 20:42
мистецтво 2 2 – 83.23
№ 1 – 11
№ 2 – 13
Тоді ми можемо ввести ці числа, щоб знайти статистику тесту:
Статистика тесту: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Статистика тесту: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538
Ступені свободи: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
Ступені свободи: (20,42/11 + 83,23/13) 2 / { [ (20,42/11) 2 / (11 – 1) ] + [ (83,23/13) 2 / (13 – 1) ] } = 18,137. Ми округляємо цей результат до найближчого цілого числа, 18 .
Нарешті, ми знайдемо критичне значення t у таблиці розподілу t, яке відповідає двосторонньому тесту з альфа = 0,05 для 18 ступенів свободи:
Критичне значення t становить 2,101 . Оскільки абсолютне значення нашої тестової статистики (1,538) не перевищує критичне значення t, ми не можемо відхилити нульову гіпотезу тесту. Немає достатньо доказів, щоб стверджувати, що засоби двох популяцій істотно відрізняються.
Т-тест Уелча з Excel
Щоб виконати t-тест Велча в Excel, нам спочатку потрібно завантажити безкоштовне програмне забезпечення Analysis ToolPak. Якщо ви ще не завантажили його в Excel, я написав короткий посібник про те, як його завантажити .
Завантаживши Analysis ToolPak, ви можете виконати наведені нижче дії, щоб виконати t-тест Велча на наших двох зразках:
1. Введіть дані. Введіть значення даних для двох зразків у стовпці A і B і заголовки Sample 1 і Sample 2 у першу клітинку кожного стовпця.
2. Виконайте t-критерій Велча за допомогою Analysis ToolPak. Перейдіть на вкладку Дані на верхній стрічці. Далі в групі «Аналіз» клацніть піктограму «Пакет інструментів аналізу».
У діалоговому вікні, що з’явиться, клацніть t-тест: дві вибірки з припущенням нерівних дисперсій , а потім натисніть OK.
Нарешті, заповніть значення нижче та натисніть OK:
Має з’явитися такий результат:
Зверніть увагу, що результати цього тесту відповідають результатам, отриманим вручну:
- Статистика тесту -1,5379 .
- Двостороннє критичне значення становить 2,1009 .
- Оскільки абсолютне значення тестової статистики не перевищує двобічного критичного значення, середні значення двох сукупностей статистично не відрізняються.
- Крім того, двобічне значення p тесту становить 0,14, що перевищує 0,05 і підтверджує, що середні значення двох сукупностей статистично не відрізняються.
t-критерій Велча з використанням R
Наступний код ілюструє, як виконати t-тест Велча для наших двох зразків за допомогою мови статистичного програмування R :
#create two vectors to hold sample data values sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25) sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34) #conduct Welch's test t.test( sample1, sample2) # Welch Two Sample t-test # #data: sample1 and sample2 #t = -1.5379, df = 18.137, p-value = 0.1413 #alternative hypothesis: true difference in means is not equal to 0 #95 percent confidence interval: #-10.453875 1.614714 #sample estimates: #mean of x mean of y #19.27273 23.69231 #
Функція t.test() відображає наступний відповідний результат:
- t: тестова статистика = -1,5379
- df : ступені свободи = 18,137
- p-value: p-value двостороннього тесту = 0,1413
- 95% довірчий інтервал : 95% довірчий інтервал для справжньої різниці в середніх значеннях сукупності = (-10,45, 1,61)
Результати цього тесту відповідають результатам, отриманим вручну та за допомогою Excel: різниця середніх для цих двох популяцій не є статистично значущою на рівні альфа = 0,05.