상관관계 대 협회 : 차이점은 무엇입니까?
때때로 상호교환적으로 사용되는 두 가지 용어는 상관관계(correlation) 와 연관(association) 입니다. 그러나 통계 분야에서는 이 두 용어가 약간 다른 의미를 갖습니다.
특히 상관관계라는 단어를 사용할 때는 일반적으로 피어슨 상관계수(Pearson Correlation Coefficient)를 의미합니다. 이는 두 개의 확률 변수 X 와 Y 사이의 선형 연관성을 측정한 것입니다. 값은 -1과 1 사이입니다.
- -1은 두 변수 사이의 완벽한 음의 선형 상관 관계를 나타냅니다.
- 0은 두 변수 사이에 선형 상관관계가 없음을 나타냅니다.
- 1은 두 변수 사이의 완벽한 양의 선형 상관 관계를 나타냅니다.
반대로, 통계학자가 연관이라는 단어를 사용하는 경우 선형 이든 비선형이든 두 변수 간의 관계 를 나타낼 수 있습니다.
이 아이디어를 설명하기 위해 다음 예를 고려하십시오.
포인트 클라우드와의 상관 관계 및 연관성 시각화
두 개의 무작위 변수 사이의 상관 관계를 설명하기 위해 두 단어를 사용합니다.
1방향
- 양수: X가 증가함에 따라 Y가 증가하는 경향이 있는 경우 두 확률 변수는 양의 상관 관계를 갖습니다.
- 음수: X가 증가함에 따라 Y가 감소하는 경향이 있는 경우 두 확률 변수는 음의 상관 관계를 갖습니다.
2. 힘
- 낮음: 산점도의 점이 드물게 분산된 경우 두 확률 변수의 상관 관계가 낮습니다.
- 강함: 산점도의 점이 서로 밀접하게 그룹화되어 있는 경우 두 확률 변수는 강한 상관 관계를 갖습니다.
다음 산점도는 각 상관 관계 유형의 예를 보여줍니다.

상관관계와 비교하여 단어 연관은 두 개의 무작위 변수(선형 또는 비선형) 사이에 관계 가 있는지 여부를 알려줄 수 있습니다.
다음 분산형 차트는 몇 가지 예를 보여줍니다.

왼쪽 위 모서리에 있는 산점도는 두 확률 변수 사이의 2차 관계를 보여줍니다. 즉, 두 변수 사이에 연관성이 있지만 선형이 아님을 의미합니다.
두 변수 사이의 상관관계를 계산하면 두 변수 사이에 선형 관계가 없기 때문에 아마도 0에 가까울 것입니다.
그러나 단순히 두 변수 사이의 상관관계가 0이라는 사실을 아는 것만으로도 비선형 관계가 있다는 사실이 숨겨지기 때문에 오해의 소지가 있을 수 있습니다.
상관관계 대 연관: 요약
상관관계와 연관이라는 용어에는 다음과 같은 유사점과 차이점이 있습니다.
유사점:
- 두 용어 모두 두 확률 변수 사이에 관계가 있는지 여부를 설명하는 데 사용됩니다.
- 두 항 모두 산점도를 사용하여 두 확률 변수 간의 관계를 분석할 수 있습니다.
차이점:
- 상관관계는 두 확률 변수가 선형 관계를 갖는지 여부만 알려줄 수 있는 반면, 연관성은 두 확률 변수가 선형 관계인지 비선형 관계인지 여부를 알려줍니다.
- 상관관계는 -1과 1 사이의 숫자를 사용하여 두 확률 변수 사이의 관계를 수량화하지만 연관은 관계를 수량화하기 위해 특정 숫자를 사용하지 않습니다.
추가 리소스
피어슨 상관 계수 소개
포인트 클라우드 소개
상관관계와 회귀: 차이점은 무엇인가요?