Correlação vs. associação: qual é a diferença?


Dois termos às vezes usados de forma intercambiável são correlação e associação . No entanto, no campo da estatística, estes dois termos têm significados ligeiramente diferentes.

Em particular, quando usamos a palavra correlação , geralmente estamos falando do coeficiente de correlação de Pearson . É uma medida de associação linear entre duas variáveis aleatórias X e Y. Possui valor entre -1 e 1 onde:

  • -1 indica uma correlação linear perfeitamente negativa entre duas variáveis
  • 0 indica nenhuma correlação linear entre duas variáveis
  • 1 indica uma correlação linear perfeitamente positiva entre duas variáveis

Por outro lado, quando os estatísticos usam a palavra associação , eles podem estar se referindo a qualquer relação entre duas variáveis, seja ela linear ou não linear.

Para ilustrar essa ideia, considere os seguintes exemplos.

Visualizando correlação e associação com nuvens de pontos

Usamos duas palavras para descrever a correlação entre duas variáveis aleatórias:

1 direção

  • Positivo: duas variáveis aleatórias têm uma correlação positiva se Y tende a aumentar à medida que X aumenta.
  • Negativa: duas variáveis aleatórias têm uma correlação negativa se Y tende a diminuir à medida que X aumenta.

2. Força

  • Baixo: duas variáveis aleatórias têm uma correlação baixa se os pontos em um gráfico de dispersão estiverem esparsamente dispersos.
  • Forte: Duas variáveis aleatórias têm uma correlação forte se os pontos em um gráfico de dispersão estiverem agrupados.

Os gráficos de dispersão a seguir ilustram exemplos de cada tipo de correlação:

Comparada à correlação, a palavra associação pode nos dizer se existe ou não uma relação entre duas variáveis aleatórias: linear ou não linear.

Os gráficos de dispersão a seguir ilustram alguns exemplos:

Correlação vs associação

O gráfico de dispersão no canto superior esquerdo ilustra uma relação quadrática entre duas variáveis aleatórias, o que significa que existe uma associação entre as duas variáveis, mas não é linear.

Se calculássemos a correlação entre as duas variáveis, provavelmente seria próxima de zero porque não existe uma relação linear entre elas.

No entanto, saber simplesmente que a correlação entre as duas variáveis é zero pode ser enganador porque esconde o facto de que existe, em vez disso, uma relação não linear.

Correlação vs. associação: um resumo

Os termos correlação e associação têm as seguintes semelhanças e diferenças:

Semelhanças:

  • Ambos os termos são usados para descrever se existe ou não uma relação entre duas variáveis aleatórias.
  • Ambos os termos podem usar gráficos de dispersão para analisar a relação entre duas variáveis aleatórias.

Diferenças:

  • A correlação só pode nos dizer se duas variáveis aleatórias têm um relacionamento linear, enquanto a associação pode nos dizer se duas variáveis aleatórias têm um relacionamento linear ou não linear.
  • A correlação quantifica a relação entre duas variáveis aleatórias usando um número entre -1 e 1, mas a associação não usa um número específico para quantificar uma relação.

Recursos adicionais

Uma introdução ao coeficiente de correlação de Pearson
Uma introdução às nuvens de pontos
Correlação vs regressão: qual a diferença?

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *