Google 스프레드시트에서 선형 회귀를 수행하는 방법


선형 회귀 는 하나 이상의 설명 변수응답 변수 간의 관계를 수량화하는 데 사용할 수 있는 방법입니다.

설명변수가 1개인 경우에는 단순선형회귀를, 설명변수가 2개 이상인 경우에는 다중선형회귀를 사용합니다.

두 가지 유형의 회귀는 모두 다음 구문을 사용하는 Google Sheets LINEST() 함수를 사용하여 수행할 수 있습니다.

LINEST(known_data_y, Known_data_x, 계산_b, 자세한 정보)

금:

  • Known_data_y: 응답 값의 배열
  • Known_data_x: 설명 값 테이블
  • 계산_b: 절편을 계산할지 여부를 나타냅니다. 이는 기본적으로 TRUE이며 선형 회귀를 위해 그대로 둡니다.
  • verbose: 기울기와 절편 외에 추가 회귀 통계를 제공할지 여부를 나타냅니다. 이는 기본적으로 FALSE이지만 예제에서는 TRUE로 지정하겠습니다.

다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.

Google Sheets의 단순 선형 회귀

공부한 시간시험 결과 사이의 관계를 이해하고 싶다고 가정해 보겠습니다. 시험 공부와 시험에서 얻은 성적.

이 관계를 탐색하기 위해 학습 시간을 설명 변수로 사용하고 시험 점수를 응답 변수로 사용하여 간단한 선형 회귀를 수행할 수 있습니다.

다음 스크린샷은 셀 D2에 사용된 다음 수식을 사용하여 20명의 학생 데이터 세트를 사용하여 단순 선형 회귀를 수행하는 방법을 보여줍니다.

= LINE ( B2:B21 , A2:A21 , TRUE , TRUE )

Google 스프레드시트의 선형 회귀

다음 스크린샷은 출력에 대한 주석을 제공합니다.

Google Sheets의 회귀 출력

결과에서 가장 관련성이 높은 숫자를 해석하는 방법은 다음과 같습니다.

R 제곱: 0.72725 . 이것을 결정계수라고 합니다. 설명변수로 설명할 수 있는 반응변수의 분산 비율입니다. 이 예에서 시험 점수 변동의 약 72.73%는 공부한 시간으로 설명할 수 있습니다.

표준 오류: 5.2805 . 이는 관찰된 값과 회귀선 사이의 평균 거리입니다. 이 예에서 관측값은 회귀선에서 평균 5.2805 단위만큼 벗어납니다.

계수: 계수는 추정 회귀 방정식을 작성하는 데 필요한 숫자를 제공합니다. 이 예에서 추정된 회귀 방정식은 다음과 같습니다.

시험 점수 = 67.16 + 5.2503*(시간)

우리는 시간 계수를 공부한 시간이 추가될 때마다 시험 점수가 평균 5.2503 씩 증가해야 한다는 의미로 해석합니다. 우리는 절편 계수를 해석하여 0시간 공부하는 학생의 예상 시험 점수가 67.16 임을 의미합니다.

이 추정 회귀 방정식을 사용하여 학습 시간을 기준으로 학생의 예상 시험 점수를 계산할 수 있습니다. 예를 들어, 3시간 동안 공부한 학생은 시험 점수 82.91 을 획득해야 합니다.

시험 점수 = 67.16 + 5.2503*(3) = 82.91

Google 스프레드시트의 다중 선형 회귀

공부한 시간과 준비 시험의 횟수가 학생이 특정 대학 입학 시험에서 받는 성적에 영향을 미치는지 알고 싶다고 가정해 보겠습니다.

이 관계를 탐색하기 위해 학습 시간준비 시험을 설명 변수로, 시험 결과를 반응 변수로 사용하여 다중 선형 회귀를 수행할 수 있습니다.

다음 스크린샷은 E2 셀에 사용된 다음 수식을 사용하여 학생 20명의 데이터 세트를 사용하여 다중 선형 회귀를 수행하는 방법을 보여줍니다.

= 오른쪽 ( C2:C21 , A2:B21 , TRUE , TRUE )

Google 스프레드시트의 다중 선형 회귀

결과에서 가장 관련성이 높은 숫자를 해석하는 방법은 다음과 같습니다.

R 제곱: 0.734 . 이것을 결정계수라고 합니다. 설명변수로 설명할 수 있는 반응변수의 분산의 비율입니다. 이 예에서 시험 점수 변동의 73.4%는 공부한 시간과 응시한 준비 시험 횟수로 설명됩니다.

표준 오류: 5.3657 . 이는 관찰된 값과 회귀선 사이의 평균 거리입니다. 이 예에서 관측값은 회귀선에서 평균 5.3657 단위만큼 벗어납니다.

추정 회귀 방정식: 모델 출력의 계수를 사용하여 다음과 같은 추정 회귀 방정식을 만들 수 있습니다.

시험 점수 = 67.67 + 5.56*(시간) – 0.60*(준비 시험)

이 추정 회귀 방정식을 사용하여 학습 시간과 응시하는 연습 시험 횟수를 기반으로 학생의 예상 시험 점수를 계산할 수 있습니다. 예를 들어, 3시간 동안 공부하고 시험을 치르는 학생은 83.75 점을 받아야 합니다.

시험 점수 = 67.67 + 5.56*(3) – 0.60*(1) = 83.75

추가 리소스

다음 튜토리얼에서는 Google Sheets에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Google Sheets에서 다항식 회귀를 수행하는 방법
Google 스프레드시트에서 잔차 그림을 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다