Как выполнить t-тест парных выборок в python
T-критерий парных выборок используется для сравнения средних значений двух выборок, когда каждое наблюдение в одной выборке может быть связано с наблюдением в другой выборке.
В этом руководстве объясняется, как выполнить t-тест парных выборок в Python.
Пример: T-тест для парных выборок в Python
Предположим, мы хотим знать, оказывает ли определенная учебная программа существенное влияние на успеваемость учащихся на конкретном экзамене. Чтобы проверить это, мы просим 15 учеников в классе пройти предварительный тест. Затем каждый из студентов участвует в учебной программе в течение двух недель. Затем учащиеся повторно сдают тест аналогичной сложности.
Чтобы сравнить разницу между средними баллами по первому и второму тестам, мы используем t-критерий для парных выборок, поскольку для каждого учащегося его балл по первому тесту может быть связан с его баллом по второму тесту.
Выполните следующие шаги, чтобы выполнить t-тест парных выборок в Python.
Шаг 1: Создайте данные.
Сначала мы создадим две таблицы, которые будут содержать оценки до и после теста:
pre = [88, 82, 84, 93, 75, 78, 84, 87, 95, 91, 83, 89, 77, 68, 91] post = [91, 84, 88, 90, 79, 80, 88, 90, 90, 96, 88, 89, 81, 74, 92]
Шаг 2: Выполните Т-тест для парных образцов.
Далее мы воспользуемся функцией ttest_rel() из библиотеки scipy.stats для выполнения t-теста парных выборок, который использует следующий синтаксис:
test_rel(а, б)
Золото:
- а: таблица выборочных наблюдений из группы 1
- б: таблица выборочных наблюдений из группы 2
Вот как использовать эту функцию в нашем конкретном примере:
import scipy.stats as stats #perform the paired samples t-test stats.ttest_rel(pre, post) (statistic=-2.9732, pvalue=0.0101)
Статистика теста равна -2,9732 , а соответствующее двустороннее значение p равно 0,0101 .
Шаг 3: Интерпретируйте результаты.
В этом примере t-критерий парных выборок использует следующие нулевые и альтернативные гипотезы:
H 0 : Средние баллы до и после теста равны.
H A : Средние баллы до и после теста не равны.
Поскольку значение p ( 0,0101 ) меньше 0,05, мы отвергаем нулевую гипотезу. У нас есть достаточно доказательств, чтобы сказать, что истинный средний балл теста различен для студентов до и после участия в учебной программе.