Excel: 회귀 출력에서 p 값을 해석하는 방법


다중 선형 회귀는 둘 이상의 예측 변수와 반응 변수 간의 관계를 수량화하는 데 사용됩니다.

다중 선형 회귀를 수행할 때마다 예측 변수와 응답 변수 간의 관계가 통계적으로 유의한지 여부를 확인하기 위해 항상 결과의 p-값에 관심이 있습니다.

이 튜토리얼에서는 Excel의 다중 선형 회귀 모델 출력에서 p-값을 해석하는 방법을 설명합니다.

예: Excel의 회귀 출력에서 P 값 해석

공부한 시간과 준비 시험의 횟수가 학생이 특정 대학 입학 시험에서 받는 성적에 영향을 미치는지 알고 싶다고 가정해 보겠습니다.

이 관계를 탐색하기 위해 학습 시간준비 시험을 예측 변수로, 시험 점수를 응답 변수로 사용하여 다중 선형 회귀를 수행할 수 있습니다.

다음 스크린샷은 Excel에서 이 모델의 회귀 출력을 보여줍니다.

Excel의 다중 선형 회귀 출력

결과에서 살펴봐야 할 세 가지 p-값이 있습니다.

  • 전체 모델의 P-값
  • 첫 번째 예측 변수의 P 값(시간)
  • 두 번째 예측 변수의 P 값(준비 시험)

각 p-값을 해석하는 방법은 다음과 같습니다.

전체 모델의 P-값

전체 모델에 대한 p-값은 결과의 F 유의성 열에서 찾을 수 있습니다.

이 p-값이 0.00 임을 알 수 있습니다.

이 값은 0.05보다 작으므로 회귀모형 전체가 통계적으로 유의하다는 결론을 내릴 수 있습니다.

즉, 공부한 시간과 응시한 준비 시험의 조합이 최종 시험 성적과 통계적으로 유의미한 관계를 갖는다는 것입니다.

첫 번째 예측 변수의 P 값(시간)

첫 번째 예측 변수인 시간에 대한 p-값은 0.00입니다.

이 값은 0.05보다 작으므로 공부한 시간이 통계적으로 유의하다는 결론을 내릴 수 있습니다.

즉, 학생이 공부하는 시간은 기말고사 성적과 통계적으로 유의미한 관계를 갖는다.

두 번째 예측 변수의 P 값(준비 시험)

두 번째 예측 변수인 준비 시험에 대한 p-값은 0.52입니다.

이 값은 0.05 이상이므로 응시 횟수가 통계적으로 유의하지 않다고 결론을 내릴 수 있습니다.

즉, 학생이 치르는 준비고사 횟수와 기말고사 성적은 통계적으로 유의미한 관계가 없다는 것이다.

이 변수는 통계적으로 유의하지 않기 때문에 전체 모델에 큰 개선을 제공하지 않으므로 모델에서 제거하기로 결정할 수 있습니다.

이 경우 연구된 시간 만 예측 변수로 사용하여 간단한 선형 회귀를 수행할 수 있습니다.

추가 리소스

다음 자습서에서는 Excel에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Excel에서 단순 선형 회귀를 수행하는 방법
Excel에서 다중 선형 회귀를 수행하는 방법
Excel에서 다항식 회귀를 수행하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다