상관관계와 회귀: 차이점은 무엇인가요?


상관관계회귀 는 서로 관련되어 있지만 완전히 동일하지는 않은 통계 용어입니다.

이 튜토리얼에서는 두 용어에 대한 간략한 설명을 제공하고 두 용어가 어떻게 유사하고 다른지 설명합니다.

상관관계란 무엇입니까?

상관관계는 두 변수 xy 간의 선형 연관성을 측정합니다. -1과 1 사이의 값을 가집니다. 여기서:

  • -1은 두 변수 사이의 완벽한 음의 선형 상관 관계를 나타냅니다.
  • 0은 두 변수 사이에 선형 상관관계가 없음을 나타냅니다.
  • 1은 두 변수 사이의 완벽한 양의 선형 상관 관계를 나타냅니다.

예를 들어 (1) 학습 시간 및 (2) 20명의 학생에 대해 받은 시험 점수라는 두 개의 변수가 포함된 다음 데이터 세트가 있다고 가정합니다.

시험 결과와 공부한 시간의 산점도를 만든 경우 다음과 같습니다.

그래프만 봐도 공부를 많이 한 학생이 시험 성적이 더 좋은 경향이 있다는 것을 알 수 있습니다. 즉, 두 변수 사이에 양의 상관관계가 있음을 시각적으로 확인할 수 있습니다.

계산기를 사용하면 이 두 변수 사이의 상관관계가 r = 0.915 임을 알 수 있습니다. 이 값은 1에 가까우므로 두 변수 간에 강한 양의 상관관계가 있음을 확인합니다.

회귀란 무엇입니까?

회귀는 변수 x 값의 변경이 변수 y 값에 어떤 영향을 미치는지 이해하는 데 사용할 수 있는 방법입니다.

회귀 모델은 하나의 변수 x 를 예측 변수로 사용하고 다른 변수 y응답 변수 로 사용합니다. 그런 다음 두 변수 간의 관계를 가장 잘 설명하는 다음 형식의 방정식을 찾습니다.

ŷ = b0 + b1x

금:

  • ŷ: 반응변수의 예측값
  • b 0 : 원점의 세로좌표(x가 0일 때 y의 값)
  • b 1 : 회귀계수(x가 1단위 증가할 때 y의 평균 증가)
  • x: 예측 변수의 값

예를 들어 이전 데이터세트를 고려해 보세요.

선형 회귀 계산기를 사용하여 다음 방정식이 이 두 변수 간의 관계를 가장 잘 설명한다는 것을 알 수 있습니다.

예상 시험 점수 = 65.47 + 2.58*(학습 시간)

이 방정식을 해석하는 방법은 다음과 같습니다.

  • 0시간 공부하는 학생의 예상 시험 점수는 65.47 입니다.
  • 추가 학습 시간과 관련된 평균 시험 점수 증가는 2.58 입니다.

또한 이 방정식을 사용하여 학생이 공부한 시간을 기준으로 받을 점수를 예측할 수 있습니다.

예를 들어 6시간 공부한 학생은 80.95 점을 받아야 합니다.

예상 시험 점수 = 65.47 + 2.58*(6) = 80.95 .

이 방정식을 산점도의 선으로 그릴 수도 있습니다.

산점도의 상관관계 및 회귀선

회귀선이 데이터에 매우 잘 “맞는” 것을 볼 수 있습니다.

앞에서 이 두 변수 사이의 상관관계가 r = 0.915 였다는 것을 기억해 보십시오. 이 값을 제곱하면 예측 변수로 설명할 수 있는 응답 변수의 전체 분산 비율을 설명하는 “r 제곱”이라는 숫자를 얻을 수 있습니다.

이 예에서는 r 2 = 0.915 2 = 0.837 입니다 . 이는 시험 점수 변동의 83.7%가 공부 시간에 의해 설명될 수 있음을 의미합니다.

상관관계 대 회귀: 유사점과 차이점

다음은 상관관계와 회귀분석의 유사점과 차이점을 요약한 것입니다.

유사점:

  • 둘 다 두 변수 사이의 관계 방향을 수량화합니다.
  • 둘 다 두 변수 사이의 관계 강도를 정량화합니다.

차이점:

  • 회귀분석은 두 변수 사이의 원인과 결과 관계를 보여줄 수 있습니다. 상관관계는 그렇게 하지 않습니다.
  • 회귀 분석에서는 방정식을 사용하여 다른 변수의 값을 기반으로 한 변수의 값을 예측할 수 있습니다. 상관관계는 그렇게 하지 않습니다.
  • 회귀 분석에서는 방정식을 사용하여 두 변수 간의 관계를 수량화합니다. 상관관계는 단일 숫자를 사용합니다.

추가 리소스

다음 자습서에서는 이 문서에서 다루는 주제에 대한 더 자세한 설명을 제공합니다.

피어슨 상관 계수 소개
단순 선형 회귀 소개
단순 선형 회귀 계산기
좋은 R 제곱 값이란 무엇입니까?

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다