Как выполнить знаковый ранговый тест уилкоксона в python
Критерий знакового ранга Уилкоксона — это непараметрическая версия t-критерия для парных выборок .
Он используется для проверки того, существует ли значительная разница между средними значениями двух популяций, когда распределение различий между двумя выборками нельзя считать нормальным.
В этом руководстве объясняется, как выполнить знаковый ранговый тест Уилкоксона в Python.
Пример: знак рангового теста Уилкоксона в Python
Исследователи хотят знать, вызывает ли новая обработка топлива изменение среднего расхода топлива на галлон определенного автомобиля. Чтобы проверить это, они измерили расход миль на галлон у 12 автомобилей с обработкой топлива и без нее.
Используйте следующие шаги, чтобы выполнить знаковый ранговый тест Уилкоксона в Python, чтобы определить, существует ли разница в среднем расходе миль на галлон между двумя группами.
Шаг 1: Создайте данные.
Сначала мы создадим две таблицы для хранения значений миль на галлон для каждой группы автомобилей:
group1 = [20, 23, 21, 25, 18, 17, 18, 24, 20, 24, 23, 19] group2 = [24, 25, 21, 22, 23, 18, 17, 28, 24, 27, 21, 23]
Шаг 2. Выполните знаковый ранговый тест Уилкоксона.
Далее мы воспользуемся функцией wilcoxon() из библиотеки scipy.stats для выполнения знакового рангового теста Уилкоксона, который использует следующий синтаксис:
wilcoxon(x, y, альтернатива=’два лица’)
Золото:
- x: таблица выборочных наблюдений из группы 1.
- y: таблица выборочных наблюдений из группы 2
- альтернатива: определяет альтернативную гипотезу. По умолчанию установлено «двустороннее», но есть и другие варианты: «меньше» и «больше».
Вот как использовать эту функцию в нашем конкретном примере:
import scipy.stats as stats #perform the Wilcoxon-Signed Rank Test stats.wilcoxon(group1, group2) (statistic=10.5, pvalue=0.044)
Статистика теста равна 10,5 , а соответствующее двустороннее значение p составляет 0,044 .
Шаг 3: Интерпретируйте результаты.
В этом примере критерий знакового ранга Уилкоксона использует следующие нулевые и альтернативные гипотезы:
H 0 : MPG одинаков между двумя группами.
H A : MPG не одинаков между двумя группами.
Поскольку значение p ( 0,044 ) меньше 0,05, мы отвергаем нулевую гипотезу. У нас есть достаточно доказательств, чтобы сказать, что истинный средний расход миль на галлон не равен между двумя группами.