Как выполнить u-тест манна-уитни на python
U-критерий Манна-Уитни используется для сравнения различий между двумя выборками, когда распределение выборок не является нормальным и размеры выборки малы (n < 30).
Он считается непараметрическим эквивалентом двухвыборочного t-критерия .
В этом руководстве объясняется, как выполнить U-тест Манна-Уитни в Python.
Пример: U-тест Манна-Уитни в Python
Исследователи хотят знать, вызывает ли обработка топлива изменение среднего расхода топлива автомобиля. Чтобы проверить это, они измерили расход миль на галлон у 12 автомобилей с пропиткой и 12 автомобилей без пропитки.
Поскольку размеры выборки невелики, и исследователи подозревают, что распределение выборки не является нормальным, они решили провести U-критерий Манна-Уитни, чтобы определить, существует ли статистически значимая разница в расходе миль на галлон между двумя группами.
Выполните следующие шаги, чтобы выполнить U-тест Манна-Уитни в Python.
Шаг 1: Создайте данные.
Сначала мы создадим две таблицы для хранения значений миль на галлон для каждой группы автомобилей:
group1 = [20, 23, 21, 25, 18, 17, 18, 24, 20, 24, 23, 19] group2 = [24, 25, 21, 22, 23, 18, 17, 28, 24, 27, 21, 23]
Шаг 2. Проведите U-тест Манна-Уитни.
Далее мы воспользуемся функцией mannwhitneyu() из библиотеки scipy.stats для выполнения U-теста Манна-Уитни, который использует следующий синтаксис:
mannwhitneyu(x, y, use_continuity=True, Альтернатива=Нет)
Золото:
- x: таблица выборочных наблюдений из группы 1.
- y: таблица выборочных наблюдений из группы 2
- use_continuity: если необходимо учитывать поправку непрерывности (1/2). По умолчанию установлено значение «Истина».
- альтернатива: определяет альтернативную гипотезу. По умолчанию установлено значение «Нет», при котором вычисляется значение p, равное половине «двустороннего» значения p. Другие варианты включают «двусторонний», «меньше» и «плюс».
Вот как использовать эту функцию в нашем конкретном примере:
import scipy.stats as stats #perform the Mann-Whitney U test stats. mannwhitneyu (group1, group2, alternative=' two-sided ') (statistic=50.0, pvalue=0.2114)
Статистика теста равна 50,0 , а соответствующее двустороннее значение p равно 0,2114 .
Шаг 3: Интерпретируйте результаты.
В этом примере U-тест Манна-Уитни использует следующие нулевую и альтернативную гипотезы:
H 0 : MPG одинаков между двумя группами.
H A : MPG не одинаков между двумя группами.
Поскольку значение p ( 0,2114 ) не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.
Это означает, что у нас недостаточно доказательств, чтобы сказать, что истинное среднее количество миль на галлон в этих двух группах различается.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнить U-тест Манна-Уитни в различных статистических программах:
Как выполнить U-тест Манна-Уитни в Excel
Как выполнить U-тест Манна-Уитни в R
Как выполнить U-тест Манна-Уитни в SPSS