Excel: 회귀 출력에서 p 값을 해석하는 방법
다중 선형 회귀는 둘 이상의 예측 변수와 반응 변수 간의 관계를 수량화하는 데 사용됩니다.
다중 선형 회귀를 수행할 때마다 예측 변수와 응답 변수 간의 관계가 통계적으로 유의한지 여부를 확인하기 위해 항상 결과의 p-값에 관심이 있습니다.
이 튜토리얼에서는 Excel의 다중 선형 회귀 모델 출력에서 p-값을 해석하는 방법을 설명합니다.
예: Excel의 회귀 출력에서 P 값 해석
공부한 시간과 준비 시험의 횟수가 학생이 특정 대학 입학 시험에서 받는 성적에 영향을 미치는지 알고 싶다고 가정해 보겠습니다.
이 관계를 탐색하기 위해 학습 시간 과 준비 시험을 예측 변수로, 시험 점수를 응답 변수로 사용하여 다중 선형 회귀를 수행할 수 있습니다.
다음 스크린샷은 Excel에서 이 모델의 회귀 출력을 보여줍니다.
결과에서 살펴봐야 할 세 가지 p-값이 있습니다.
- 전체 모델의 P-값
- 첫 번째 예측 변수의 P 값(시간)
- 두 번째 예측 변수의 P 값(준비 시험)
각 p-값을 해석하는 방법은 다음과 같습니다.
전체 모델의 P-값
전체 모델에 대한 p-값은 결과의 F 유의성 열에서 찾을 수 있습니다.
이 p-값이 0.00 임을 알 수 있습니다.
이 값은 0.05보다 작으므로 회귀모형 전체가 통계적으로 유의하다는 결론을 내릴 수 있습니다.
즉, 공부한 시간과 응시한 준비 시험의 조합이 최종 시험 성적과 통계적으로 유의미한 관계를 갖는다는 것입니다.
첫 번째 예측 변수의 P 값(시간)
첫 번째 예측 변수인 시간에 대한 p-값은 0.00입니다.
이 값은 0.05보다 작으므로 공부한 시간이 통계적으로 유의하다는 결론을 내릴 수 있습니다.
즉, 학생이 공부하는 시간은 기말고사 성적과 통계적으로 유의미한 관계를 갖는다.
두 번째 예측 변수의 P 값(준비 시험)
두 번째 예측 변수인 준비 시험에 대한 p-값은 0.52입니다.
이 값은 0.05 이상이므로 응시 횟수가 통계적으로 유의하지 않다고 결론을 내릴 수 있습니다.
즉, 학생이 치르는 준비고사 횟수와 기말고사 성적은 통계적으로 유의미한 관계가 없다는 것이다.
이 변수는 통계적으로 유의하지 않기 때문에 전체 모델에 큰 개선을 제공하지 않으므로 모델에서 제거하기로 결정할 수 있습니다.
이 경우 연구된 시간 만 예측 변수로 사용하여 간단한 선형 회귀를 수행할 수 있습니다.
추가 리소스
다음 자습서에서는 Excel에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Excel에서 단순 선형 회귀를 수행하는 방법
Excel에서 다중 선형 회귀를 수행하는 방법
Excel에서 다항식 회귀를 수행하는 방법