Як виконати t-тест із двома зразками в python


Двовибірковий t-критерій використовується, щоб перевірити, чи рівні середні дві сукупності чи ні.

У цьому підручнику пояснюється, як виконати двовибірковий t-тест у Python.

Приклад: два приклади t-тесту в Python

Дослідники хочуть знати, чи мають два різні види рослин однакову середню висоту. Щоб перевірити це, вони збирають просту випадкову вибірку з 20 рослин кожного виду.

Виконайте наступні кроки, щоб виконати t-тест із двома зразками, щоб визначити, чи два види рослин мають однакову висоту.

Крок 1: Створіть дані.

Спочатку ми створимо дві таблиці для вимірювань для кожної групи з 20 рослин:

 import numpy as np

group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12])
group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])

Крок 2: Виконайте двовибірковий t-тест.

Далі ми використаємо функцію ttest_ind() із бібліотеки scipy.stats, щоб виконати два приклади t-тесту, який використовує такий синтаксис:

ttest_ind(a, b, equal_var=True)

золото:

  • а: таблиця прикладів спостережень для 1 групи
  • б: таблиця прикладів спостережень для 2 групи
  • equal_var: якщо істинно, виконати стандартний незалежний t-тест із 2 вибірками, який передбачає рівні дисперсії генеральної сукупності. Якщо false, виконайте t-критерій Велча , який не передбачає рівних дисперсій сукупності. Це вірно за умовчанням.

Перед виконанням тесту нам потрібно вирішити, чи будемо ми припускати, що дві генеральні сукупності мають однакові дисперсії. Загалом можна припустити, що сукупності мають однакові дисперсії, якщо відношення найбільшої дисперсії вибірки до найменшої дисперсії вибірки менше ніж 4:1.

 #find variance for each group
print(np.var(group1), np.var(group2))

7.73 12.26

Відношення найбільшої дисперсії вибірки до найменшої дисперсії вибірки становить 12,26/7,73 = 1,586 , що менше 4. Це означає, що ми можемо припустити, що дисперсії генеральної сукупності рівні.

Таким чином, ми можемо продовжити виконання двовибіркового t-тесту з рівними дисперсіями:

 import scipy.stats as stats

#perform two sample t-test with equal variances
stats.ttest_ind(a=group1, b=group2, equal_var=True)

(statistic=-0.6337, pvalue=0.53005)

Статистичний показник t-критерію становить -0,6337 , а відповідне двобічне значення p становить 0,53005 .

Крок 3: Інтерпретація результатів.

Два припущення для цього конкретного двовибіркового t-тесту:

H 0 : µ 1 = µ 2 (два середні сукупності рівні)

H A : µ 1 ≠µ 2 (два середні сукупності не рівні)

Оскільки p-значення нашого тесту (0,53005) більше, ніж альфа = 0,05, ми не можемо відхилити нульову гіпотезу тесту. У нас немає достатніх доказів, щоб стверджувати, що середня висота рослин у двох популяціях різна.

Додаткові ресурси

Як виконати T-тест з одним зразком у Python
Як виконати T-тест парних зразків у Python

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *