상관관계는 언제 사용해야 합니까? (설명 및 예시)
상관관계는 두 변수 사이의 선형 연관성을 측정하는 데 사용됩니다.
상관 계수는 항상 -1과 1 사이의 값을 갖습니다. 여기서:
- -1은 두 변수 사이의 완벽한 음의 선형 상관 관계를 나타냅니다.
- 0은 두 변수 사이에 선형 상관관계가 없음을 나타냅니다.
- 1은 두 변수 사이의 완벽한 양의 선형 상관 관계를 나타냅니다.
학생들이 자주 묻는 질문은 언제 상관 관계를 사용해야 합니까? 입니다.
짧은 대답: 두 변수 사이의 선형 관계를 정량화하고 두 변수 모두 반응이나 “결과” 변수를 나타내지 않을 때 상관 관계를 사용하십시오 .
다음 예에서는 실제로 상관관계를 사용해야 하는 경우와 사용하지 말아야 하는 경우를 보여줍니다.
예시 1: 상관 관계를 사용하는 경우
교수가 수업 시간에 학생들의 수학 시험 점수와 과학 시험 점수 사이의 선형 관계를 이해하고 싶어한다고 가정해 보겠습니다.
예를 들어, 수학 시험을 잘 본 학생이 과학 시험도 잘 보나요? 아니면 수학에서 높은 점수를 받은 학생이 과학에서 낮은 점수를 받는 경향이 있습니까?
이 시나리오에서 그는 수학 시험 점수와 과학 시험 점수 사이의 상관관계를 계산할 수 있습니다. 왜냐하면 그는 단지 두 변수 사이의 선형 관계를 이해하고 싶고 두 변수 모두 반응 변수로 간주될 수 없기 때문입니다.
그가 피어슨 상관 계수를 계산하여 r = 0.78이라는 것을 발견했다고 가정합니다. 이는 강한 양의 상관관계가 있는데, 이는 수학을 잘하는 학생이 과학도 잘하는 경향이 있다는 것을 의미합니다.
예시 2: 상관관계를 사용하지 않는 경우
한 회사의 마케팅 부서에서 광고비가 총 수익에 미치는 영향을 수량화하려고 한다고 가정해 보겠습니다.
예를 들어, 광고에 추가로 지출된 1달러에 대해 회사는 얼마나 많은 추가 수익을 얻을 것으로 예상할 수 있습니까?
이 시나리오에서는 “수익” 변수가 응답 변수이기 때문에 부서에서는 선형 회귀 모델을 사용하여 광고 지출과 총 수익 사이의 관계를 수량화해야 합니다.
해당 부서에서 단순 선형 회귀 모델을 적용하고 다음 방정식이 광고 지출과 총 수익 간의 관계를 가장 잘 설명한다는 사실을 발견했다고 가정해 보겠습니다.
총수익 = 145.4 + 0.34*(광고비)
이는 광고에 추가로 1달러를 지출할 때마다 총 수익이 평균 0.34달러 증가한다는 의미로 해석됩니다.
Correlation 사용 시 주의사항
상관관계는 두 변수 사이의 선형 관계를 수량화하는 데에만 사용될 수 있다는 점에 유의하는 것이 중요합니다.
그러나 특정 상황에서는 상관 계수가 비선형 관계를 공유하는 두 변수 간의 관계를 효과적으로 포착할 수 없습니다.
예를 들어, 두 변수 간의 관계를 시각화하기 위해 다음 산점도를 생성한다고 가정합니다.

이 두 변수 사이의 상관계수를 계산하면 r = 0이 됩니다. 이는 두 변수 사이에 선형 관계가 없다는 것을 의미합니다.
그러나 그래프에서 우리는 두 변수가 실제로 관계를 가지고 있음을 알 수 있습니다. 이는 선형 관계가 아닌 단순히 2차 관계입니다.
따라서 두 변수 간의 상관 관계를 계산할 때 산점도를 만들어 변수 간의 관계를 시각화하는 것도 유용할 수 있다는 점을 명심하세요.
두 변수가 선형 관계가 아니더라도 산점도에 나타나는 비선형 관계를 가질 가능성이 있습니다.
추가 리소스
다음 튜토리얼에서는 다양한 상황에서 상관 관계가 사용되는 방법을 자세히 설명합니다.
상관관계의 6가지 실제 사례
“강한” 상관관계로 간주되는 것은 무엇입니까?
상관관계 대 협회 : 차이점은 무엇입니까?
상관관계와 회귀: 차이점은 무엇인가요?