조정된 결정 계수(조정된 r 제곱)

이 문서에서는 통계에서 조정된 결정계수(또는 조정된 R 제곱)가 무엇인지, 그리고 어떤 용도로 사용되는지 설명합니다. 마찬가지로 조정된 결정계수를 계산하는 방법과 이를 해석하는 방법, 그리고 조정된 결정계수를 계산하는 온라인 계산기도 알아봅니다.

조정된 결정계수는 무엇입니까?

수정 결정계수 ( 수정 R 제곱 이라고도 함)는 모델에 포함된 설명 변수의 수를 고려하여 회귀 모델의 적합도를 나타내는 계수입니다.

조정된 결정계수에 대한 기호는 다음과 같습니다.

\bar{R}^2

.

따라서 조정된 결정 계수는 회귀 모델에 의해 설명되는 백분율을 측정하여 모델에 도입된 각 설명 변수에 대해 페널티를 적용합니다. 일반적으로 회귀 모델에 변수가 많을수록 데이터 샘플을 더 잘 설명할 수 있지만 모델은 더 복잡해집니다. 따라서 우리는 데이터를 가장 잘 설명하지만 가능한 변수가 가장 적은 모델을 찾아야 합니다.

이러한 이유로 조정된 결정 계수는 다양한 회귀 모델 간의 적합도를 비교하는 데 사용됩니다. 모델의 변수 수를 고려하면 이 통계 계수는 모델을 다른 변수와 비교하는 데 매우 유용합니다. 아래에서는 수정된 결정계수를 해석하는 방법을 살펴보겠습니다.

통계에서는 수정된 결정계수를 수정된 결정계수 라고도 합니다.

조정된 결정계수 공식

수정된 결정계수를 계산하는 공식은 다음과 같습니다.

\bar{R}^2=1-\cfrac{N-1}{N-k-1}\cdot (1-R^2)

금:

  • \bar{R}^2

    는 조정된 결정계수입니다.

  • R^2

    결정계수 입니다.

  • N

    표본 크기입니다.

  • k

    회귀 모델의 설명 변수 수입니다.

👉 아래 계산기를 사용하여 조정된 결정계수를 계산할 수 있습니다.

조정된 결정계수에 대한 공식을 분석하면 조정되지 않은 결정계수보다 항상 낮다는 것을 추론할 수 있습니다.

조정된 결정계수의 해석

조정된 결정계수의 정의와 그 공식이 무엇인지 살펴본 후, 이 섹션에서는 그 값을 해석하는 방법을 살펴보겠습니다.

일반적으로 조정된 결정계수의 값은 0과 1 사이이지만 일반적으로 백분율로 표시되며 최소값은 0%, 최대값은 100%입니다.

조정된 결정 계수의 해석 과 관련하여 값이 높을수록 회귀 모델이 데이터 샘플을 더 잘 설명합니다. 즉, 수정된 결정계수가 1에 가까울수록 모델이 더 좋아진다는 의미입니다. 반면, 0에 가까울수록 생성된 회귀 모델의 신뢰성이 떨어집니다.

마찬가지로, 얻은 회귀 모델이 이전 가설을 충족한다는 점을 명심해야 합니다. 예를 들어, 조정 결정계수가 매우 높은 모델은 잔차의 변동성이 일정하지 않은 경우(동분산성) 이전 가정 중 하나를 충족하지 않기 때문에 쓸모가 없습니다.

일반적으로 회귀 모델에 독립 변수가 많을수록 변수가 중요하지 않더라도 조정되지 않은 회귀 계수가 높아집니다. 그러나 회귀 모델에 변수가 많다는 것은 중요하지 않습니다. 이로 인해 모델과 분석이 복잡해지기 때문입니다.

조정된 결정계수는 이 문제를 해결합니다. 포함된 각 변수에 대해 페널티를 적용함으로써 다양한 수의 변수를 가진 여러 모델을 비교하고 가장 관심 있는 모델을 선택할 수 있습니다. 따라서 다양한 회귀 모델 간의 비교를 위해 단순 결정 계수 대신 조정된 결정 계수가 일반적으로 사용됩니다.

조정된 결정계수 계산기

다음 온라인 계산기에 데이터를 입력하여 조정된 결정 계수를 계산합니다. 점을 소수 구분 기호로 사용하여 숫자를 입력해야 합니다(예: 0.8509).

조정되지 않은 결정 계수

R^2=

표본 크기

N=

설명변수의 개수

k=

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다