R 배수 또는 r 제곱: 차이점은 무엇인가요?


대부분의 통계 소프트웨어를 사용하여 회귀 모델을 피팅하면 결과에서 다음 두 가지 값이 나타나는 경우가 많습니다.

다중 R: 세 개 이상의 변수 사이의 다중 상관 계수입니다.

R-Square: (Multiple R) 2 로 계산되며 예측 변수로 설명할 수 있는 회귀 모델의 응답 변수 의 분산 비율을 나타냅니다. 이 값은 0에서 1까지 다양합니다.

실제로 우리는 R-제곱 값에 관심이 있는 경우가 많습니다. 왜냐하면 예측 변수가 반응 변수의 값을 예측하는 데 얼마나 유용한지 알려주기 때문입니다.

그러나 모델에 새로운 예측 변수를 추가할 때마다 예측 변수가 유용하지 않더라도 R-제곱은 증가하는 것이 보장됩니다.

조정된 R-제곱은 회귀 모델의 예측 변수 수를 조정하는 R-제곱의 수정된 버전입니다. 다음과 같이 계산됩니다.

조정된 R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]

금:

  • R 2 : 모델의 R 2
  • n : 관측치 수
  • k : 예측 변수의 수

모델에 더 많은 예측변수를 추가하면 R-제곱이 항상 증가하므로 조정된 R-제곱은 모델의 예측변수 수에 따라 조정되어 모델이 얼마나 유용한지 알려주는 측정항목 역할을 할 수 있습니다.

이러한 각 용어를 더 잘 이해하려면 다음 예를 고려하십시오.

예: 다중 R, R-제곱 및 조정된 R-제곱

12명의 학생에 대한 다음 세 가지 변수를 포함하는 다음 데이터 세트가 있다고 가정합니다.

학습 시간현재 성적을 예측 변수로, 시험 점수를 응답 변수로 사용하여 다중 선형 회귀 모델을 적합하고 다음 결과를 얻는다고 가정합니다.

다중 R 대 R 제곱

다음 세 가지 지표의 값을 관찰할 수 있습니다.

다중 R: 0.978 . 이는 반응 변수와 두 예측 변수 간의 다중 상관 관계를 나타냅니다.

R 제곱: 0.956 . 이는 (다중 R) 2 = (0.978) 2 = 0.956으로 계산됩니다. 이는 시험 점수 변동의 95.6%가 학생이 공부한 시간과 해당 과목의 현재 성적에 의해 설명될 수 있음을 말해줍니다.

조정된 R-제곱: 0.946 . 이는 다음과 같이 계산됩니다.

조정된 R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)] = 1 – [(1-.956)*(12-1)/(12-2-1) ] = 0.946.

이는 모델의 예측 변수 수에 맞게 조정된 R 제곱 값을 나타냅니다.

예를 들어, 10개의 예측변수를 사용하여 또 다른 회귀 모델을 피팅하고 해당 모델의 조정된 R-제곱이 0.88 인 경우 이 측정값이 유용합니다. 이는 두 개의 예측 변수만 있는 회귀 모델이 더 높은 조정된 R 제곱 값을 갖기 때문에 더 낫다는 것을 나타냅니다.

추가 리소스

다중 선형 회귀 소개
좋은 R 제곱 값이란 무엇입니까?

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다