Как выполнить точный тест фишера в excel
Точный критерий Фишера используется для определения наличия значимой связи между двумя категориальными переменными. Обычно он используется в качестве альтернативы критерию независимости хи-квадрат, когда количество одной или нескольких ячеек в таблице 2 × 2 меньше 5.
В этом руководстве объясняется, как выполнить точный тест Фишера в Excel.
Пример: точный критерий Фишера в Excel.
Предположим, мы хотим знать, связан ли пол с предпочтением политической партии в конкретном колледже. Чтобы выяснить это, мы случайным образом опросили 25 студентов кампуса. Количество студентов-демократов или республиканцев в зависимости от их пола показано в таблице ниже:
Чтобы определить, существует ли статистически значимая связь между полом и предпочтениями политических партий, мы можем провести точный тест Фишера.
Хотя в Excel нет встроенной функции для выполнения этого теста, мы можем использовать для выполнения теста гипергеометрическую функцию, которая использует следующий синтаксис:
=HYPGEOM.DIST(выборка_s, число_выборка, популяция_s, число_популяция, совокупное)
Золото:
- sample_s = количество «успехов» в выборке
- число_выборки = размер выборки
- Population_s = количество «успехов» в популяции
- Number_pop = численность населения
- кумулятивный = если TRUE, это возвращает кумулятивную функцию распределения; если ЛОЖЬ, это возвращает функцию массы вероятности. Для наших целей мы всегда будем использовать TRUE.
Чтобы применить эту функцию к нашему примеру, мы выберем для использования одну из четырех ячеек таблицы 2×2. Подойдет любая ячейка, но в этом примере мы будем использовать верхнюю левую ячейку со значением «4».
Далее мы заполним следующие значения для функции:
= ГИПГЕОМ.РАСП (значение в отдельной ячейке, общее количество столбцов, общее количество строк, общий размер выборки, ИСТИНА)
Это дает одностороннее значение p 0,0812 .
Чтобы найти двустороннее значение p для теста, мы добавим следующие две вероятности:
- Вероятность получения x «успеха» в интересующей ячейке. В нашем случае это вероятность получения 4 успехов (мы уже определили, что эта вероятность равна 0,0812).
- 1 – вероятность попадания (общее количество столбцов – х «успех») в интересующую ячейку. В данном случае общее количество столбцов для демократа равно 12, поэтому найдем 1 – (вероятность 8 «успеха»).
Вот формула, которую мы будем использовать:
Это дает двустороннее значение p, равное 0,1152 .
В обоих случаях, независимо от того, выполняем ли мы односторонний или двусторонний тест, значение p не меньше 0,05, поэтому мы не можем отвергнуть нулевую гипотезу. Другими словами, у нас нет достаточных доказательств, чтобы сказать, что существует значительная связь между полом и предпочтениями политических партий.
Дополнительные ресурсы
Как выполнить тест независимости хи-квадрат в Excel
Как выполнить тест на соответствие хи-квадрату в Excel
Как рассчитать V Крамера в Excel