Google 스프레드시트에서 선형 회귀를 수행하는 방법
선형 회귀 는 하나 이상의 설명 변수 와 응답 변수 간의 관계를 수량화하는 데 사용할 수 있는 방법입니다.
설명변수가 1개인 경우에는 단순선형회귀를, 설명변수가 2개 이상인 경우에는 다중선형회귀를 사용합니다.
두 가지 유형의 회귀는 모두 다음 구문을 사용하는 Google Sheets LINEST() 함수를 사용하여 수행할 수 있습니다.
LINEST(known_data_y, Known_data_x, 계산_b, 자세한 정보)
금:
- Known_data_y: 응답 값의 배열
- Known_data_x: 설명 값 테이블
- 계산_b: 절편을 계산할지 여부를 나타냅니다. 이는 기본적으로 TRUE이며 선형 회귀를 위해 그대로 둡니다.
- verbose: 기울기와 절편 외에 추가 회귀 통계를 제공할지 여부를 나타냅니다. 이는 기본적으로 FALSE이지만 예제에서는 TRUE로 지정하겠습니다.
다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.
Google Sheets의 단순 선형 회귀
공부한 시간 과 시험 결과 사이의 관계를 이해하고 싶다고 가정해 보겠습니다. 시험 공부와 시험에서 얻은 성적.
이 관계를 탐색하기 위해 학습 시간을 설명 변수로 사용하고 시험 점수를 응답 변수로 사용하여 간단한 선형 회귀를 수행할 수 있습니다.
다음 스크린샷은 셀 D2에 사용된 다음 수식을 사용하여 20명의 학생 데이터 세트를 사용하여 단순 선형 회귀를 수행하는 방법을 보여줍니다.
= LINE ( B2:B21 , A2:A21 , TRUE , TRUE )
다음 스크린샷은 출력에 대한 주석을 제공합니다.
결과에서 가장 관련성이 높은 숫자를 해석하는 방법은 다음과 같습니다.
R 제곱: 0.72725 . 이것을 결정계수라고 합니다. 설명변수로 설명할 수 있는 반응변수의 분산 비율입니다. 이 예에서 시험 점수 변동의 약 72.73%는 공부한 시간으로 설명할 수 있습니다.
표준 오류: 5.2805 . 이는 관찰된 값과 회귀선 사이의 평균 거리입니다. 이 예에서 관측값은 회귀선에서 평균 5.2805 단위만큼 벗어납니다.
계수: 계수는 추정 회귀 방정식을 작성하는 데 필요한 숫자를 제공합니다. 이 예에서 추정된 회귀 방정식은 다음과 같습니다.
시험 점수 = 67.16 + 5.2503*(시간)
우리는 시간 계수를 공부한 시간이 추가될 때마다 시험 점수가 평균 5.2503 씩 증가해야 한다는 의미로 해석합니다. 우리는 절편 계수를 해석하여 0시간 공부하는 학생의 예상 시험 점수가 67.16 임을 의미합니다.
이 추정 회귀 방정식을 사용하여 학습 시간을 기준으로 학생의 예상 시험 점수를 계산할 수 있습니다. 예를 들어, 3시간 동안 공부한 학생은 시험 점수 82.91 을 획득해야 합니다.
시험 점수 = 67.16 + 5.2503*(3) = 82.91
Google 스프레드시트의 다중 선형 회귀
공부한 시간과 준비 시험의 횟수가 학생이 특정 대학 입학 시험에서 받는 성적에 영향을 미치는지 알고 싶다고 가정해 보겠습니다.
이 관계를 탐색하기 위해 학습 시간 과 준비 시험을 설명 변수로, 시험 결과를 반응 변수로 사용하여 다중 선형 회귀를 수행할 수 있습니다.
다음 스크린샷은 E2 셀에 사용된 다음 수식을 사용하여 학생 20명의 데이터 세트를 사용하여 다중 선형 회귀를 수행하는 방법을 보여줍니다.
= 오른쪽 ( C2:C21 , A2:B21 , TRUE , TRUE )
결과에서 가장 관련성이 높은 숫자를 해석하는 방법은 다음과 같습니다.
R 제곱: 0.734 . 이것을 결정계수라고 합니다. 설명변수로 설명할 수 있는 반응변수의 분산의 비율입니다. 이 예에서 시험 점수 변동의 73.4%는 공부한 시간과 응시한 준비 시험 횟수로 설명됩니다.
표준 오류: 5.3657 . 이는 관찰된 값과 회귀선 사이의 평균 거리입니다. 이 예에서 관측값은 회귀선에서 평균 5.3657 단위만큼 벗어납니다.
추정 회귀 방정식: 모델 출력의 계수를 사용하여 다음과 같은 추정 회귀 방정식을 만들 수 있습니다.
시험 점수 = 67.67 + 5.56*(시간) – 0.60*(준비 시험)
이 추정 회귀 방정식을 사용하여 학습 시간과 응시하는 연습 시험 횟수를 기반으로 학생의 예상 시험 점수를 계산할 수 있습니다. 예를 들어, 3시간 동안 공부하고 시험을 치르는 학생은 83.75 점을 받아야 합니다.
시험 점수 = 67.67 + 5.56*(3) – 0.60*(1) = 83.75
추가 리소스
다음 튜토리얼에서는 Google Sheets에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Google Sheets에서 다항식 회귀를 수행하는 방법
Google 스프레드시트에서 잔차 그림을 만드는 방법