Т-тест велча: коли його використовувати + приклади


Коли ми хочемо порівняти середні значення двох незалежних груп, ми можемо вибрати між використанням двох різних тестів:

Т-критерій Стьюдента: цей тест припускає, що дві групи даних відібрано з сукупностей, які дотримуються нормального розподілу , і що дві сукупності мають однакову дисперсію.

Т-критерій Велча: цей тест припускає, що обидві групи даних відібрано з сукупностей, які дотримуються нормального розподілу, але не передбачає, що ці дві сукупності мають однакову дисперсію .

Різниця між t-критерієм Стьюдента та t-критерієм Уелча

Існує дві відмінності в тому, як виконуються t-критерій Стьюдента та t-критерій Велча:

  • Статистика тесту
  • Ступені свободи

Т-критерій Стьюдента:

Статистика тесту: ( x 1x 2 ) / s p (√ 1/n 1 + 1/n 2 )

де x 1 і x 2 — середні значення вибірки, n 1 і n 2 — розміри вибірки для вибірки 1 і вибірки 2 відповідно, і де s p обчислюється наступним чином:

s p = (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

де s 1 2 і s 2 2 – вибіркові дисперсії.

Ступені свободи: n 1 + n 2 – 2

Т-критерій Велча

Статистика тесту: ( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

Ступені свободи: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }

Формула для обчислення ступенів свободи для t-критерію Велча враховує різницю між двома стандартними відхиленнями. Якщо два зразки мають однакові стандартні відхилення, то ступені свободи t-критерію Велча будуть точно такими ж, як і ступені свободи t-критерію Стьюдента.

Як правило, стандартні відхилення для двох зразків не однакові, тому ступені свободи t-критерію Велча мають тенденцію бути меншими, ніж ступені свободи t-критерію Стьюдента.

Також важливо відзначити, що ступені свободи в t-критерії Велча, як правило, не є цілим числом. Якщо ви тестуєте вручну, найкраще округлити до найменшого цілого числа. Якщо ви використовуєте статистичне програмне забезпечення, наприклад R , програмне забезпечення зможе надати десяткове значення ступенів свободи.

Коли слід використовувати t-критерій Велча?

Деякі люди стверджують, що t-критерій Велча має бути вибором за замовчуванням для порівняння середніх значень двох незалежних груп, оскільки він працює краще, ніж t-критерій Стьюдента, коли розміри вибірки та дисперсії між групами неоднакові, і дає ідентичні результати, коли розміри вибірки різні. різниці рівні.

На практиці, коли ви порівнюєте середні значення двох груп, малоймовірно, що стандартні відхилення кожної групи будуть однаковими. Тому доцільно завжди використовувати t-критерій Велча, щоб вам не доводилося робити припущення щодо рівності дисперсій.

Приклади використання t-критерію Велча

Далі ми виконаємо t-критерій Велча на наступних двох вибірках, щоб визначити, чи відрізняються середні значення сукупності суттєво на рівні значущості 0,05:

Зразок 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25

Зразок 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34

Ми проілюструємо, як виконати тест трьома різними способами:

  • За руку
  • Використовуйте Microsoft Excel
  • Використовуйте статистичну мову програмування R

Т-тест Велча вручну

Щоб виконати t-критерій Велча вручну, нам спочатку потрібно знайти вибіркові середні значення, вибіркові дисперсії та розміри вибірки:

х1 19,27
х2 23,69
s 1 2 – 20:42
мистецтво 2 2 – 83.23
1 – 11
2 – 13

Тоді ми можемо ввести ці числа, щоб знайти статистику тесту:

Статистика тесту: ( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

Статистика тесту: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538

Ступені свободи: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }

Ступені свободи: (20,42/11 + 83,23/13) 2 / { [ (20,42/11) 2 / (11 – 1) ] + [ (83,23/13) 2 / (13 – 1) ] } = 18,137. Ми округляємо цей результат до найближчого цілого числа, 18 .

Нарешті, ми знайдемо критичне значення t у таблиці розподілу t, яке відповідає двосторонньому тесту з альфа = 0,05 для 18 ступенів свободи:

Таблиця розподілу Т

Критичне значення t становить 2,101 . Оскільки абсолютне значення нашої тестової статистики (1,538) не перевищує критичне значення t, ми не можемо відхилити нульову гіпотезу тесту. Немає достатньо доказів, щоб стверджувати, що засоби двох популяцій істотно відрізняються.

Т-тест Уелча з Excel

Щоб виконати t-тест Велча в Excel, нам спочатку потрібно завантажити безкоштовне програмне забезпечення Analysis ToolPak. Якщо ви ще не завантажили його в Excel, я написав короткий посібник про те, як його завантажити .

Завантаживши Analysis ToolPak, ви можете виконати наведені нижче дії, щоб виконати t-тест Велча на наших двох зразках:

1. Введіть дані. Введіть значення даних для двох зразків у стовпці A і B і заголовки Sample 1 і Sample 2 у першу клітинку кожного стовпця.

2. Виконайте t-критерій Велча за допомогою Analysis ToolPak. Перейдіть на вкладку Дані на верхній стрічці. Далі в групі «Аналіз» клацніть піктограму «Пакет інструментів аналізу».

У діалоговому вікні, що з’явиться, клацніть t-тест: дві вибірки з припущенням нерівних дисперсій , а потім натисніть OK.

Нарешті, заповніть значення нижче та натисніть OK:

Має з’явитися такий результат:

Зверніть увагу, що результати цього тесту відповідають результатам, отриманим вручну:

  • Статистика тесту -1,5379 .
  • Двостороннє критичне значення становить 2,1009 .
  • Оскільки абсолютне значення тестової статистики не перевищує двобічного критичного значення, середні значення двох сукупностей статистично не відрізняються.
  • Крім того, двобічне значення p тесту становить 0,14, що перевищує 0,05 і підтверджує, що середні значення двох сукупностей статистично не відрізняються.

t-критерій Велча з використанням R

Наступний код ілюструє, як виконати t-тест Велча для наших двох зразків за допомогою мови статистичного програмування R :

 #create two vectors to hold sample data values
sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25)
sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34)

#conduct Welch's test
t.test( sample1, sample2)

# Welch Two Sample t-test
#
#data: sample1 and sample2
#t = -1.5379, df = 18.137, p-value = 0.1413
#alternative hypothesis: true difference in means is not equal to 0
#95 percent confidence interval:
#-10.453875 1.614714
#sample estimates:
#mean of x mean of y 
#19.27273 23.69231 
#

Функція t.test() відображає наступний відповідний результат:

  • t: тестова статистика = -1,5379
  • df : ступені свободи = 18,137
  • p-value: p-value двостороннього тесту = 0,1413
  • 95% довірчий інтервал : 95% довірчий інтервал для справжньої різниці в середніх значеннях сукупності = (-10,45, 1,61)

Результати цього тесту відповідають результатам, отриманим вручну та за допомогою Excel: різниця середніх для цих двох популяцій не є статистично значущою на рівні альфа = 0,05.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *