Excel에서 sst, ssr 및 sse를 계산하는 방법
우리는 회귀선 이 실제로 데이터 세트에 얼마나 잘 맞는지 측정하기 위해 세 가지 다른 제곱합 값을 사용하는 경우가 많습니다.
1. 총 제곱합(SST) – 개별 데이터 포인트(y i )와 응답 변수의 평균( y ) 간의 차이의 제곱합입니다.
- SST = Σ(y i – y ) 2
2. SSR(제곱합 회귀) – 예측된 데이터 포인트(ŷ i )와 응답 변수의 평균( y ) 간의 차이의 제곱합입니다.
- SSR = Σ(ŷ i – y ) 2
3. 제곱합 오류(SSE) – 예측된 데이터 포인트(ŷ i )와 관찰된 데이터 포인트(y i ) 간의 차이의 제곱의 합입니다.
- SSE = Σ(ŷ i – y i ) 2
다음 단계별 예에서는 Excel에서 특정 회귀 모델에 대해 이러한 각 측정항목을 계산하는 방법을 보여줍니다.
1단계: 데이터 생성
먼저, 특정 학교에서 20명의 학생에 대해 얻은 공부 시간과 시험 점수가 포함된 데이터 세트를 만들어 보겠습니다.
2단계: 회귀 모델 적합
Excel 상단 리본에서 데이터 탭을 클릭하고 데이터 분석을 클릭합니다. 이 옵션이 표시되지 않으면 먼저 무료 Analysis ToolPak 소프트웨어를 설치 해야 합니다.
데이터 분석을 클릭하면 새 창이 나타납니다. 회귀를 선택하고 확인을 클릭합니다.
나타나는 새 창에서 다음 정보를 제공하십시오.
확인을 클릭하면 회귀 결과가 나타납니다.
3단계: 결과 분석
세 가지 제곱합 측정항목(SST, SSR 및 SSE)은 분산 분석 테이블의 SS 열에서 볼 수 있습니다.
측정항목은 다음과 같습니다.
- 총 제곱합(SST): 1248.55
- SSR(제곱합 회귀): 917.4751
- 제곱합 오류(SSE): 331.0749
SST = SSR + SSE를 확인할 수 있습니다.
- SST = SSR + SSE
- 1248.55 = 917.4751 + 331.0749
회귀 모델의 R 제곱을 수동으로 계산할 수도 있습니다.
- R 제곱 = SSR / SST
- R 제곱 = 917.4751 / 1248.55
- R 제곱 = 0.7348
이는 시험 점수 변동의 73.48%가 공부 시간에 의해 설명될 수 있음을 말해줍니다.
추가 리소스
Excel에서 단순 선형 회귀를 수행하는 방법
Excel에서 다중 선형 회귀를 수행하는 방법
Excel에서 다항식 회귀를 수행하는 방법
Excel에서 지수 회귀를 수행하는 방법