Como calcular a correlação policórica em r


A correlação policórica é usada para calcular a correlação entre variáveis ordinais.

Lembre-se de que variáveis ordinais são variáveis cujos valores possíveis são categóricos e possuem ordem natural.

Aqui estão alguns exemplos de variáveis medidas em uma escala ordinal:

  • Satisfação : Muito insatisfeito, insatisfeito, neutro, satisfeito, muito satisfeito
  • Nível de renda : Baixa renda, renda média, renda alta
  • Status do local de trabalho : Analista de entrada, Analista I, Analista II, Analista Sênior
  • Nível de dor : quantidade baixa, quantidade média, quantidade alta

O valor da correlação policórica varia de -1 a 1 onde:

  • -1 indica correlação negativa perfeita
  • 0 indica nenhuma correlação
  • 1 indica uma correlação positiva perfeita

Podemos usar a função polychor(x, y) do pacote polycor para calcular a correlação policórica entre duas variáveis ordinais em R.

Os exemplos a seguir mostram como usar esta função na prática.

Exemplo 1: Calcular Correlação Policórica para Avaliações de Filmes

Digamos que você queira saber se duas agências de classificação de filmes diferentes têm uma alta correlação entre suas classificações de filmes.

Pedimos a cada agência que avalie 20 filmes diferentes numa escala de 1 a 3 onde:

  • 1 indica “ruim”
  • 2 indica “ruim”
  • 3 indica “bom”

Podemos usar o seguinte código em R para calcular a correlação policórica entre os ratings das duas agências:

 library (polycor)

#define movie ratings for each agency
agency1 <- c(1, 1, 2, 2, 3, 2, 2, 3, 2, 3, 3, 2, 1, 2, 2, 1, 1, 1, 2, 2)
agency2 <- c(1, 1, 2, 1, 3, 3, 3, 2, 2, 3, 3, 3, 2, 2, 2, 1, 2, 1, 3, 3)

#calculate polychoric correlation between ratings
polychor(agency1, agency2)

[1] 0.7828328

A correlação policórica acaba sendo 0,78 .

Este valor é bastante elevado, indicando que existe uma forte associação positiva entre os ratings de cada agência.

Exemplo 2: Calcular correlação policórica para avaliações de restaurantes

Digamos que você queira saber se dois restaurantes de bairro diferentes têm uma correlação entre as avaliações dos clientes de seus restaurantes.

Pesquisamos aleatoriamente 20 clientes que comeram nos dois restaurantes e pedimos que avaliassem sua satisfação geral em uma escala de 1 a 5, onde:

  • 1 indica “muito insatisfeito”
  • 2 indica “insatisfeito”
  • 3 indica “neutro”
  • 4 indica “satisfeito”
  • 5 indica “muito satisfeito”

Podemos usar o seguinte código em R para calcular a correlação policórica entre as avaliações dos dois restaurantes:

 library (polycor)

#define ratings for each restaurant
restaurant1 <- c(1, 1, 2, 2, 2, 3, 3, 3, 2, 2, 3, 4, 4, 5, 5, 4, 3, 4, 5, 5)
restaurant2 <- c(4, 3, 3, 4, 3, 3, 4, 5, 4, 4, 4, 5, 5, 4, 2, 1, 1, 2, 1, 4)

#calculate polychoric correlation between ratings
polychor(restaurant1, restaurant2)

[1] -0.1322774

A correlação policórica acaba sendo -0,13 .

Este valor está próximo de zero, indicando que há muito pouca (ou nenhuma) associação entre as classificações dos restaurantes.

Recursos adicionais

Os tutoriais a seguir explicam como calcular outros coeficientes de correlação comuns em R:

Como calcular a correlação de classificação de Spearman em R
Como calcular a correlação ponto-bisserial em R
Como calcular a correlação cruzada em R
Como calcular a correlação deslizante em R
Como calcular a correlação parcial em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *