Как выполнить точный тест фишера на python
Точный критерий Фишера используется для определения наличия значимой связи между двумя категориальными переменными.
Обычно он используется в качестве альтернативы критерию независимости хи-квадрат , когда количество одной или нескольких ячеек в таблице 2 × 2 меньше 5.
В этом руководстве объясняется, как выполнить точный тест Фишера в Python.
Пример: точный тест Фишера в Python
Предположим, мы хотим знать, связан ли пол с предпочтением политической партии в конкретном колледже.
Чтобы выяснить это, мы случайным образом опросили 25 студентов кампуса. Количество студентов-демократов или республиканцев в зависимости от их пола показано в таблице ниже:
Демократ | республиканец | |
---|---|---|
Женский | 8 | 4 |
Мужской | 4 | 9 |
Чтобы определить, существует ли статистически значимая связь между полом и предпочтениями политических партий, мы можем использовать следующие шаги для выполнения точного теста Фишера на Python:
Шаг 1: Создайте данные.
Сначала мы создадим таблицу для хранения наших данных:
data = [[8, 4], [4, 9]]
Шаг 2: Проведите точный тест Фишера.
Далее мы можем выполнить точный тест Фишера, используя функцию fisher_exact из библиотеки SciPy, которая использует следующий синтаксис:
fisher_exact(таблица, альтернатива=’два лица’)
Золото:
- таблица: таблица непредвиденных обстоятельств 2×2.
- альтернатива: определяет альтернативную гипотезу. По умолчанию установлено «двусторонний», но вы также можете выбрать «меньше» или «больше» для односторонних тестов.
Следующий код показывает, как использовать эту функцию в нашем конкретном примере:
import scipy.stats as stats print(stats.fisher_exact(data)) (4.5, 0.1152)
Значение p для тестирования составляет 0,1152 .
Точный критерий Фишера использует следующие нулевые и альтернативные гипотезы:
- H 0 : (нулевая гипотеза) Обе переменные независимы.
- H 1 : (альтернативная гипотеза) Эти две переменные не являются независимыми.
Поскольку это значение p не меньше 0,05, мы не отвергаем нулевую гипотезу.
Поэтому у нас нет достаточных доказательств, чтобы сказать, что существует значительная связь между полом и предпочтениями политических партий.
Другими словами, предпочтения пола и политических партий независимы.