Excel에서 2차 회귀를 수행하는 방법

에 의해 벤자민 앤더슨 7월 29, 2023 가이드 댓글 0개

회귀 는 하나 이상의 예측 변수와 반응 변수 간의 관계를 설명하는 데 사용할 수 있는 통계 기법입니다. 가장 일반적인 유형의 회귀는 예측 변수와 응답 변수 간의 관계가 선형 일 때 사용하는 선형 회귀 입니다.

즉, 예측변수가 증가하면 반응변수도 증가하는 경향이 있다. 예를 들어, 선형 회귀 모델을 사용하여 공부한 시간(예측 변수)과 학생이 받는 시험 성적(반응 변수) 사이의 관계를 설명할 수 있습니다.

그러나 예측 변수와 반응 변수 간의 관계가 비선형 인 경우도 있습니다. 비선형 관계의 일반적인 유형은 그래프에서 U 또는 거꾸로 된 U처럼 보일 수 있는 2차 관계 입니다.

즉, 예측변수가 증가하면 반응변수도 증가하는 경향이 있으나, 일정 시점 이후에는 예측변수가 계속 증가하면서 반응변수가 감소하기 시작한다.

예를 들어, 2차 회귀 모델을 사용하여 근무 시간과 개인이 보고한 행복 수준 사이의 관계를 설명할 수 있습니다. 아마도 일을 많이 할수록 성취감을 더 많이 느낄 수도 있지만, 특정 한계점에 도달하면 실제로는 일이 많아지면 스트레스가 생기고 행복도가 감소하게 됩니다. 이 경우 2차 회귀 모델은 선형 회귀 모델보다 데이터에 더 잘 맞습니다.

Excel에서 2차 회귀를 수행하는 방법에 대한 예를 검토해 보겠습니다.

Excel의 2차 회귀

주당 근무 시간에 대한 데이터가 있고 16명의 서로 다른 사람들에 대해 보고된 행복 수준(0~100점)이 있다고 가정해 보겠습니다.

먼저, 선형 회귀가 데이터에 적합한 모델인지 알아보기 위해 산점도를 만들어 보겠습니다.

셀 A2:B17 을 강조 표시합니다. 그런 다음 상단 리본에 있는 삽입 탭을 클릭한 다음 차트 영역에서 분산형을 클릭합니다. 그러면 데이터의 산점도가 생성됩니다.

근무 시간과 보고된 행복 사이의 관계가 선형적이 지 않다는 것을 쉽게 알 수 있습니다. 실제로 “U” 모양을 따르므로 2차 회귀 분석 에 완벽한 후보가 됩니다.

2차 회귀 모델을 데이터에 맞추기 전에 예측 변수의 제곱 값에 대한 새 열을 만들어야 합니다.

먼저 B 열의 모든 값을 강조 표시하고 C 열로 드래그합니다.

그런 다음 셀 B2에 수식 =A2^2 를 입력합니다. 그러면 값 36 이 생성됩니다. 그런 다음 B2 셀의 오른쪽 하단을 클릭하고 아래쪽 수식을 끌어 B열의 나머지 셀을 채웁니다.

다음으로 2차 회귀 모델을 피팅하겠습니다.

상단 리본에서 데이터를 클릭한 다음 맨 오른쪽에 있는 데이터 분석 옵션을 클릭합니다. 이 옵션이 표시되지 않으면 먼저 무료 Analysis ToolPak 소프트웨어를 설치 해야 합니다.

데이터 분석을 클릭하면 상자가 나타납니다. 회귀 를 클릭한 다음 확인 을 클릭합니다.

다음으로 나타나는 회귀 상자에 다음 값을 입력합니다. 그런 다음 확인을 클릭합니다.

다음 결과가 표시됩니다.

출력의 다양한 숫자를 해석하는 방법은 다음과 같습니다.

R 제곱: 결정 계수라고도 하며 예측 변수로 설명할 수 있는 반응 변수의 분산 비율입니다. 이 예에서 R 제곱은 0.9092 입니다. 이는 보고된 행복 수준의 변동 중 90.92%가 근무 시간과 근무 시간 ^2로 설명될 수 있음을 나타냅니다.

표준오차: 회귀의 표준오차는 관측값과 회귀선 사이의 평균 거리입니다. 이 예에서 관측값은 회귀선에서 평균 9,519 단위 만큼 벗어납니다.

F-통계량 : F-통계량은 회귀 MS/잔차 MS로 계산됩니다. 이 통계는 회귀 모델이 독립 변수가 없는 모델보다 데이터에 더 잘 맞는지 여부를 나타냅니다. 기본적으로 회귀 모델 전체가 유용한지 여부를 테스트합니다. 일반적으로 모형의 예측 변수가 통계적으로 유의하지 않은 경우 전체 F 통계량도 통계적으로 유의하지 않습니다. 이 예에서 F 통계량은 65.09 이고 해당 p-값은 <0.0001입니다. 이 p-값은 0.05보다 작으므로 전체적으로 회귀 모델이 중요합니다.

회귀 계수: 마지막 표의 회귀 계수는 추정 회귀 방정식을 작성하는 데 필요한 숫자를 제공합니다.

y _모자 = b ₀ + b ₁ x ₁ + b ₂ x ₁ ²

이 예에서 추정된 회귀 방정식은 다음과 같습니다.

선언된 행복 수준 = -30.252 + 7.173(근로 시간) -0.106(근로 시간) ²

우리는 이 방정식을 사용하여 근무 시간을 기준으로 개인의 기대 행복 수준을 계산할 수 있습니다. 예를 들어, 주당 30시간 일하는 사람의 기대 행복 수준은 다음과 같습니다.

보고된 행복 수준 = -30.252 + 7.173(30) -0.106(30) ² = 88.649 .

추가 리소스

Excel에서 2차 추세선을 추가하는 방법
회귀표를 읽고 해석하는 방법
좋은 R 제곱 값이란 무엇입니까?
회귀의 표준 오류 이해
회귀 분석의 전반적인 유의성에 대한 F-검정을 이해하기 위한 간단한 가이드

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

Excel의 2차 회귀

추가 리소스

저자 소개

벤자민 앤더슨

의견을 추가하다