Como calcular a correlação ponto-bisserial em r
A correlação ponto-bisserial é usada para medir a relação entre uma variável binária, x, e uma variável contínua, y.
Semelhante ao coeficiente de correlação de Pearson , o coeficiente de correlação ponto-bisserial assume um valor entre -1 e 1 onde:
- -1 indica uma correlação perfeitamente negativa entre duas variáveis
- 0 indica nenhuma correlação entre duas variáveis
- 1 indica uma correlação perfeitamente positiva entre duas variáveis
Este tutorial explica como calcular a correlação ponto-bisserial entre duas variáveis em R.
Exemplo: correlação ponto-bisserial em R
Suponha que temos uma variável binária, x, e uma variável contínua, y:
x <- c(0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0) y <- c(12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12)
Podemos usar a função R integrada cor.test() para calcular a correlação ponto-bisserial entre as duas variáveis:
#calculate point-biserial correlation
cor.test(x, y)
Pearson's product-moment correlation
data: x and y
t = 0.67064, df = 9, p-value = 0.5193
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.4391885 0.7233704
sample estimates:
horn
0.2181635
Pelo resultado podemos observar o seguinte:
- O coeficiente de correlação ponto-bisserial é 0,218
- O valor p correspondente é 0,5193
Como o coeficiente de correlação é positivo, isso indica que quando a variável x assume o valor “1”, a variável y tende a assumir valores mais elevados do que quando a variável x assume o valor “0”.
No entanto, como o valor p desta correlação não é inferior a 0,05, esta correlação não é estatisticamente significativa.
Observe que o resultado também fornece um intervalo de confiança de 95% para o verdadeiro coeficiente de correlação, que é:
IC 95% = (-0,439, 0,723)
Uma vez que este intervalo de confiança contém zero, isto fornece mais evidências de que o coeficiente de correlação não é estatisticamente significativo.
Nota : Você pode encontrar a documentação completa da função cor.test() aqui .
Recursos adicionais
Os tutoriais a seguir explicam como calcular outros coeficientes de correlação em R:
Como calcular a correlação parcial em R
Como calcular a correlação deslizante em R
Como calcular a correlação de classificação de Spearman em R
Como calcular a correlação policórica em R