Как рассчитать коэффициент фи в r
Коэффициент Фи (иногда называемый среднеквадратичным коэффициентом непредвиденности ) является мерой связи между двумя двоичными переменными.
Для таблицы 2×2, заданной для двух случайных величин x и y :
Коэффициент Фи можно рассчитать следующим образом:
Φ = (AD-BC) / √ (A+B)(C+D)(A+C)(B+D)
Пример: расчет коэффициента Фи в R
Предположим, мы хотим знать, связан ли пол с предпочтением той или иной политической партии. Итак, мы берем простую случайную выборку из 25 избирателей и спрашиваем их об их предпочтениях в отношении той или иной политической партии.
В следующей таблице представлены результаты опроса:
Мы можем использовать следующий код для ввода этих данных в матрицу 2×2 в R:
#create 2x2 table data = matrix(c(4, 8, 9, 4), nrow = 2 ) #view dataset data [,1] [,2] [1,] 4 9 [2,] 8 4
Затем мы можем использовать функцию phi() из пакета psych для расчета коэффициента Phi между двумя переменными:
#load psych package library (psych) #calculate Phi Coefficient phi(data) [1] -0.36
Коэффициент Фи оказывается -0,36 .
Обратите внимание, что функция phi по умолчанию округляет до 2 цифр, но вы можете указать функцию для округления до любого количества цифр:
#calculate Phi Coefficient and round to 6 digits phi(data, digits = 6 ) [1] -0.358974
Как интерпретировать коэффициент Фи
Подобно коэффициенту корреляции Пирсона, коэффициент Фи принимает значения от -1 до 1, где:
- -1 указывает на совершенно отрицательную связь между двумя переменными.
- 0 указывает на отсутствие связи между двумя переменными.
- 1 указывает на совершенно положительную связь между двумя переменными.
В общем, чем дальше коэффициент Фи от нуля, тем сильнее связь между двумя переменными.
Другими словами, чем дальше коэффициент Фи от нуля, тем больше свидетельств какой-то систематической закономерности между двумя переменными.
Дополнительные ресурсы
Введение в коэффициент Фи
Калькулятор коэффициента Фи