Quando usar a correlação de classificação de spearman (2 cenários)


A forma mais comum de quantificar a associação linear entre duas variáveis é utilizar o coeficiente de correlação de Pearson , que assume sempre um valor entre -1 e 1 onde:

  • -1 indica uma correlação linear perfeitamente negativa
  • 0 indica nenhuma correlação linear
  • 1 indica uma correlação linear perfeitamente positiva

No entanto, este tipo de coeficiente de correlação funciona melhor quando a verdadeira relação subjacente entre as duas variáveis é linear .

Existe outro tipo de coeficiente de correlação chamado correlação de classificação de Spearman que é melhor usado em dois cenários específicos:

Cenário 1 : Ao trabalhar com dados classificados.

  • Um exemplo poderia ser um conjunto de dados contendo a classificação da nota do exame de matemática de um aluno, bem como a classificação da nota do exame de ciências em uma turma.

Cenário 2 : Quando um ou mais valores extremos estão presentes.

  • Quando valores discrepantes extremos estão presentes em um conjunto de dados, o coeficiente de correlação de Pearson é bastante afetado.

Os exemplos a seguir mostram como calcular a correlação de classificação de Spearman em cada um desses cenários.

Cenário 1: Correlacionando a classificação de Spearman com dados classificados

Considere o seguinte conjunto de dados (e o gráfico de dispersão correspondente) que mostra a relação entre duas variáveis:

Usando software estatístico, podemos calcular os seguintes coeficientes de correlação para essas duas variáveis:

  • Correlação de Pearson: 0,79
  • Correlação de classificação de Spearman: 1

Nesse cenário, se nos importarmos apenas com a classificação dos valores dos dados (conforme a classificação de x aumenta, a classificação de y também aumenta?), então a correlação de classificação de Spearman nos daria uma ideia melhor do correlação entre as duas variáveis. .

Neste conjunto de dados específico, à medida que a classificação de x aumenta, a classificação de y sempre aumenta.

A correlação de postos de Spearman captura perfeitamente esse comportamento, dizendo-nos que existe uma relação positiva perfeita ( ρ = 1 ) entre os postos de x e os postos de y.

Por outro lado, a correlação de Pearson diz-nos que existe uma forte relação linear ( r = 0,79 ) entre as duas variáveis.

Isto é verdade, mas não é útil se nos preocuparmos apenas com a relação entre os postos de x e os postos de y.

Cenário 2: Correlação da classificação de Spearman com valores discrepantes extremos

Considere o seguinte conjunto de dados (e o gráfico de dispersão correspondente) que mostra a relação entre duas variáveis:

Usando software estatístico, podemos calcular os seguintes coeficientes de correlação para essas duas variáveis:

  • Correlação de Pearson: 0,86
  • Correlação de classificação de Spearman: 0,85

Os coeficientes de correlação são quase idênticos porque a relação subjacente entre as variáveis é aproximadamente linear e não existem valores discrepantes extremos.

Agora, suponha que alteremos o último valor de y no conjunto de dados para que ele se torne um valor discrepante extremo:

Usando software estatístico, podemos recalcular os coeficientes de correlação:

  • Correlação de Pearson: 0,69
  • Correlação de classificação de Spearman: 0,85

O coeficiente de correlação de Pearson mudou significativamente, enquanto o coeficiente de correlação de Spearman permaneceu o mesmo.

Usando jargão estatístico, diríamos que a relação entre x e y é monotônica (à medida que x aumenta, y geralmente aumenta), mas não linear, uma vez que o valor discrepante influencia muito os dados.

Neste cenário, a correlação de postos de Spearman quantifica bem esta relação monotónica, enquanto a correlação de Pearson faz um mau trabalho porque tenta calcular a relação linear entre as duas variáveis.

Relacionado: Como relatar a correlação de classificação de Spearman no formato APA

Recursos adicionais

Os tutoriais a seguir explicam como calcular a correlação de classificação de Spearman usando software diferente:

Como calcular a correlação de classificação de Spearman no Excel
Como calcular a correlação de classificação de Spearman no Planilhas Google
Como calcular a correlação de classificação de Spearman em R
Como calcular a correlação de classificação de Spearman em Python

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *