Correlação vs. associação: qual é a diferença?
Dois termos às vezes usados de forma intercambiável são correlação e associação . No entanto, no campo da estatística, estes dois termos têm significados ligeiramente diferentes.
Em particular, quando usamos a palavra correlação , geralmente estamos falando do coeficiente de correlação de Pearson . É uma medida de associação linear entre duas variáveis aleatórias X e Y. Possui valor entre -1 e 1 onde:
- -1 indica uma correlação linear perfeitamente negativa entre duas variáveis
- 0 indica nenhuma correlação linear entre duas variáveis
- 1 indica uma correlação linear perfeitamente positiva entre duas variáveis
Por outro lado, quando os estatísticos usam a palavra associação , eles podem estar se referindo a qualquer relação entre duas variáveis, seja ela linear ou não linear.
Para ilustrar essa ideia, considere os seguintes exemplos.
Visualizando correlação e associação com nuvens de pontos
Usamos duas palavras para descrever a correlação entre duas variáveis aleatórias:
1 direção
- Positivo: duas variáveis aleatórias têm uma correlação positiva se Y tende a aumentar à medida que X aumenta.
- Negativa: duas variáveis aleatórias têm uma correlação negativa se Y tende a diminuir à medida que X aumenta.
2. Força
- Baixo: duas variáveis aleatórias têm uma correlação baixa se os pontos em um gráfico de dispersão estiverem esparsamente dispersos.
- Forte: Duas variáveis aleatórias têm uma correlação forte se os pontos em um gráfico de dispersão estiverem agrupados.
Os gráficos de dispersão a seguir ilustram exemplos de cada tipo de correlação:
Comparada à correlação, a palavra associação pode nos dizer se existe ou não uma relação entre duas variáveis aleatórias: linear ou não linear.
Os gráficos de dispersão a seguir ilustram alguns exemplos:
O gráfico de dispersão no canto superior esquerdo ilustra uma relação quadrática entre duas variáveis aleatórias, o que significa que existe uma associação entre as duas variáveis, mas não é linear.
Se calculássemos a correlação entre as duas variáveis, provavelmente seria próxima de zero porque não existe uma relação linear entre elas.
No entanto, saber simplesmente que a correlação entre as duas variáveis é zero pode ser enganador porque esconde o facto de que existe, em vez disso, uma relação não linear.
Correlação vs. associação: um resumo
Os termos correlação e associação têm as seguintes semelhanças e diferenças:
Semelhanças:
- Ambos os termos são usados para descrever se existe ou não uma relação entre duas variáveis aleatórias.
- Ambos os termos podem usar gráficos de dispersão para analisar a relação entre duas variáveis aleatórias.
Diferenças:
- A correlação só pode nos dizer se duas variáveis aleatórias têm um relacionamento linear, enquanto a associação pode nos dizer se duas variáveis aleatórias têm um relacionamento linear ou não linear.
- A correlação quantifica a relação entre duas variáveis aleatórias usando um número entre -1 e 1, mas a associação não usa um número específico para quantificar uma relação.
Recursos adicionais
Uma introdução ao coeficiente de correlação de Pearson
Uma introdução às nuvens de pontos
Correlação vs regressão: qual a diferença?