Как рассчитать двухрядную корреляцию в r


Точечно-бисериальная корреляция используется для измерения взаимосвязи между бинарной переменной x и непрерывной переменной y.

Подобно коэффициенту корреляции Пирсона , коэффициент точечно-бисерийной корреляции принимает значение от -1 до 1, где:

  • -1 указывает на совершенно отрицательную корреляцию между двумя переменными.
  • 0 указывает на отсутствие корреляции между двумя переменными.
  • 1 указывает на совершенно положительную корреляцию между двумя переменными.

В этом руководстве объясняется, как вычислить точечную бисериальную корреляцию между двумя переменными в R.

Пример: точечно-бисериальная корреляция в R

Предположим, у нас есть двоичная переменная x и непрерывная переменная y:

 x <- c(0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0)

y <- c(12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12)

Мы можем использовать встроенную функцию R cor.test() для расчета корреляции между точками и бисериалами между двумя переменными:

 #calculate point-biserial correlation
cor.test(x, y)

	Pearson's product-moment correlation

data: x and y
t = 0.67064, df = 9, p-value = 0.5193

alternative hypothesis: true correlation is not equal to 0

95 percent confidence interval:
 -0.4391885 0.7233704

sample estimates:
      horn 
0.2181635 

По результату мы можем наблюдать следующее:

  • Коэффициент точечно-бисерийной корреляции составляет 0,218.
  • Соответствующее значение p составляет 0,5193.

Поскольку коэффициент корреляции положителен, это указывает на то, что когда переменная x принимает значение «1», переменная y имеет тенденцию принимать более высокие значения, чем когда переменная x принимает значение «0».

Однако, поскольку значение p этой корреляции не менее 0,05, эта корреляция не является статистически значимой.

Обратите внимание, что результат также обеспечивает 95% доверительный интервал для истинного коэффициента корреляции, который оказывается следующим:

95% ДИ = (-0,439, 0,723)

Поскольку этот доверительный интервал содержит ноль, это является дополнительным доказательством того, что коэффициент корреляции не является статистически значимым.

Примечание . Полную документацию по функции cor.test() можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как рассчитать другие коэффициенты корреляции в R:

Как рассчитать частичную корреляцию в R
Как рассчитать скользящую корреляцию в R
Как рассчитать ранговую корреляцию Спирмена в R
Как рассчитать полихорическую корреляцию в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *