R 대 r-square: 차이점은 무엇입니까?


통계학에서 학생들이 자주 혼동하는 두 가지 용어는 RR-제곱 이며 종종 R2 로 표기됩니다.

단순 선형 회귀 의 맥락에서:

  • A: 예측 변수 x와 반응 변수 y 사이의 상관 관계입니다.
  • R 2 : 회귀 모델의 예측 변수로 설명할 수 있는 응답 변수의 분산 비율입니다.

다중 선형 회귀 의 맥락에서는 다음과 같습니다.

  • A: 반응변수의 관측값과 모델에 의해 만들어진 반응변수의 예측값 사이의 상관관계입니다.
  • R 2 : 회귀모델의 예측변수로 설명할 수 있는 반응변수의 분산 비율.

R 2 값은 0과 1 사이입니다. 값이 1에 가까울수록 예측 변수와 응답 변수 간의 관계가 더 강해집니다.

다음 예에서는 단순 선형 회귀 모델과 다중 선형 회귀 모델에서 R 및 R 제곱 값을 해석하는 방법을 보여줍니다.

예시 1: 단순 선형 회귀

특정 수학 과정에서 12명의 학생이 공부한 시간과 시험 점수를 보여주는 다음 데이터 세트가 있다고 가정합니다.

통계 소프트웨어(예: Excel, R, Python, SPSS 등)를 사용하여 “학습 시간”을 예측 변수로 사용하고 “시험 성적”을 응답 변수 로 사용하여 간단한 선형 회귀 모델을 적합할 수 있습니다.

이 모델에 대해 다음과 같은 출력을 찾을 수 있습니다.

이 모델의 R 및 R 제곱 값을 해석하는 방법은 다음과 같습니다.

  • 답변: 공부 시간과 시험 점수 사이의 상관관계는 0.959 입니다.
  • R 2 : 이 회귀 모델의 R 제곱은 0.920 입니다. 이는 시험 점수 변동의 92.0%가 공부 시간에 의해 설명될 수 있음을 말해줍니다.

또한 R 2 값은 단순히 R 값을 제곱한 것과 같습니다.

R2 = R * R = 0.959 * 0.959 = 0.920

예시 2: 다중 선형 회귀

특정 수학 과정에서 12명의 학생이 공부한 시간, 현재 학생 성적, 시험 성적을 보여주는 다음 데이터 세트가 있다고 가정합니다.

통계 소프트웨어를 사용하면 “학습 시간”과 “현재 성적”을 예측 변수로, “시험 성적”을 응답 변수로 사용하여 다중 선형 회귀 모델을 적합화할 수 있습니다.

이 모델에 대해 다음과 같은 출력을 찾을 수 있습니다.

이 모델의 R 및 R 제곱 값을 해석하는 방법은 다음과 같습니다.

  • A: 실제 시험 점수와 모델의 예측 시험 점수 사이의 상관관계는 0.978 입니다.
  • R 2 : 이 회귀 모델의 R 제곱은 0.956 입니다. 이는 시험 점수 변동의 95.6%가 학습 시간과 학생의 현재 수업 성적에 의해 설명될 수 있음을 말해줍니다.

또한 R 2 값은 단순히 R 값을 제곱한 것과 같습니다.

R2 = R * R = 0.978 * 0.978 = 0.956

추가 리소스

좋은 R 제곱 값이란 무엇입니까?
제곱합에 대한 친절한 안내: SST, SSR, SSE

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다