Excel에서 2차 회귀를 수행하는 방법


회귀 는 하나 이상의 예측 변수와 반응 변수 간의 관계를 설명하는 데 사용할 수 있는 통계 기법입니다. 가장 일반적인 유형의 회귀는 예측 변수와 응답 변수 간의 관계가 선형 일 때 사용하는 선형 회귀 입니다.

즉, 예측변수가 증가하면 반응변수도 증가하는 경향이 있다. 예를 들어, 선형 회귀 모델을 사용하여 공부한 시간(예측 변수)과 학생이 받는 시험 성적(반응 변수) 사이의 관계를 설명할 수 있습니다.

그러나 예측 변수와 반응 변수 간의 관계가 비선형 인 경우도 있습니다. 비선형 관계의 일반적인 유형은 그래프에서 U 또는 거꾸로 된 U처럼 보일 수 있는 2차 관계 입니다.

즉, 예측변수가 증가하면 반응변수도 증가하는 경향이 있으나, 일정 시점 이후에는 예측변수가 계속 증가하면서 반응변수가 감소하기 시작한다.

예를 들어, 2차 회귀 모델을 사용하여 근무 시간과 개인이 보고한 행복 수준 사이의 관계를 설명할 수 있습니다. 아마도 일을 많이 할수록 성취감을 더 많이 느낄 수도 있지만, 특정 한계점에 도달하면 실제로는 일이 많아지면 스트레스가 생기고 행복도가 감소하게 됩니다. 이 경우 2차 회귀 모델은 선형 회귀 모델보다 데이터에 더 잘 맞습니다.

Excel에서 2차 회귀를 수행하는 방법에 대한 예를 검토해 보겠습니다.

Excel의 2차 회귀

주당 근무 시간에 대한 데이터가 있고 16명의 서로 다른 사람들에 대해 보고된 행복 수준(0~100점)이 있다고 가정해 보겠습니다.

먼저, 선형 회귀가 데이터에 적합한 모델인지 알아보기 위해 산점도를 만들어 보겠습니다.

A2:B17 을 강조 표시합니다. 그런 다음 상단 리본에 있는 삽입 탭을 클릭한 다음 차트 영역에서 분산형을 클릭합니다. 그러면 데이터의 산점도가 생성됩니다.

근무 시간과 보고된 행복 사이의 관계가 선형적이 지 않다는 것을 쉽게 알 수 있습니다. 실제로 “U” 모양을 따르므로 2차 회귀 분석 에 완벽한 후보가 됩니다.

2차 회귀 모델을 데이터에 맞추기 전에 예측 변수의 제곱 값에 대한 새 열을 만들어야 합니다.

먼저 B 열의 모든 값을 강조 표시하고 C 열로 드래그합니다.

그런 다음 셀 B2에 수식 =A2^2 를 입력합니다. 그러면 값 36 이 생성됩니다. 그런 다음 B2 셀의 오른쪽 하단을 클릭하고 아래쪽 수식을 끌어 B열의 나머지 셀을 채웁니다.

다음으로 2차 회귀 모델을 피팅하겠습니다.

상단 리본에서 데이터를 클릭한 다음 맨 오른쪽에 있는 데이터 분석 옵션을 클릭합니다. 이 옵션이 표시되지 않으면 먼저 무료 Analysis ToolPak 소프트웨어를 설치 해야 합니다.

데이터 분석을 클릭하면 상자가 나타납니다. 회귀 를 클릭한 다음 확인 을 클릭합니다.

다음으로 나타나는 회귀 상자에 다음 값을 입력합니다. 그런 다음 확인을 클릭합니다.

다음 결과가 표시됩니다.

출력의 다양한 숫자를 해석하는 방법은 다음과 같습니다.

R 제곱: 결정 계수라고도 하며 예측 변수로 설명할 수 있는 반응 변수의 분산 비율입니다. 이 예에서 R 제곱은 0.9092 입니다. 이는 보고된 행복 수준의 변동 중 90.92%가 근무 시간과 근무 시간 ^2로 설명될 수 있음을 나타냅니다.

표준오차: 회귀의 표준오차는 관측값과 회귀선 사이의 평균 거리입니다. 이 예에서 관측값은 회귀선에서 평균 9,519 단위 만큼 벗어납니다.

F-통계량 : F-통계량은 회귀 MS/잔차 MS로 계산됩니다. 이 통계는 회귀 모델이 독립 변수가 없는 모델보다 데이터에 더 잘 맞는지 여부를 나타냅니다. 기본적으로 회귀 모델 전체가 유용한지 여부를 테스트합니다. 일반적으로 모형의 예측 변수가 통계적으로 유의하지 않은 경우 전체 F 통계량도 통계적으로 유의하지 않습니다. 이 예에서 F 통계량은 65.09 이고 해당 p-값은 <0.0001입니다. 이 p-값은 0.05보다 작으므로 전체적으로 회귀 모델이 중요합니다.

회귀 계수: 마지막 표의 회귀 계수는 추정 회귀 방정식을 작성하는 데 필요한 숫자를 제공합니다.

y 모자 = b 0 + b 1 x 1 + b 2 x 1 2

이 예에서 추정된 회귀 방정식은 다음과 같습니다.

선언된 행복 수준 = -30.252 + 7.173(근로 시간) -0.106(근로 시간) 2

우리는 이 방정식을 사용하여 근무 시간을 기준으로 개인의 기대 행복 수준을 계산할 수 있습니다. 예를 들어, 주당 30시간 일하는 사람의 기대 행복 수준은 다음과 같습니다.

보고된 행복 수준 = -30.252 + 7.173(30) -0.106(30) 2 = 88.649 .

추가 리소스

Excel에서 2차 추세선을 추가하는 방법
회귀표를 읽고 해석하는 방법

좋은 R 제곱 값이란 무엇입니까?
회귀의 표준 오류 이해
회귀 분석의 전반적인 유의성에 대한 F-검정을 이해하기 위한 간단한 가이드

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다