Google 스프레드시트에서 로지스틱 회귀를 수행하는 방법
로지스틱 회귀는 응답 변수가 이진일 때 회귀 모델을 맞추는 데 사용할 수 있는 방법입니다.
다음 단계별 예에서는 Google Sheets에서 로지스틱 회귀를 수행하는 방법을 보여줍니다.
1단계: XLMiner 분석 도구 설치
Google Sheets에서 로지스틱 회귀를 수행하려면 먼저 무료 XLMiner Analysis Toolpak을 설치해야 합니다.
이렇게 하려면 추가 기능 > 추가 기능 가져오기를 클릭하세요.
다음으로 검색창에 XLMiner Analysis ToolPak을 입력하고 나타나는 아이콘을 클릭하세요.
마지막으로 파란색 설치 버튼을 클릭하세요.
2단계: 데이터 입력
다음으로 Google 스프레드시트에 다음 데이터를 입력하겠습니다.
우리는 포인트를 사용하고 농구 선수가 NBA에 드래프트될지 여부를 예측하는 데 도움이 되는 로지스틱 회귀 모델을 적용할 것입니다(0 = 아니요, 1 = 예).
3단계: 로지스틱 회귀 수행
로지스틱 회귀 모델을 맞추려면 Extensions 탭을 클릭한 다음 XL Miner Analysis ToolPak을 클릭하고 Start를 클릭합니다.
화면 오른쪽에 나타나는 패널에서 로지스틱 회귀 옆에 있는 드롭다운 화살표를 클릭하고 다음 정보를 입력합니다.
확인을 클릭하면 로지스틱 회귀 모델의 요약이 표시됩니다.
결과의 계수는 드래프트 확률의 로그 평균 변화를 나타냅니다.
예를 들어, 1 포인트 단위 증가는 드래프트 확률이 평균 0.212 증가하는 것과 관련이 있습니다.
계수의 부호는 각 예측 변수와 반응 변수 사이에 연관된 양수 또는 음수가 있는지 여부를 알려줍니다.
예를 들어, 포인트는 계수에 대해 양의 부호를 가지므로 이는 포인트 값을 높이면 선수가 드래프트될 확률이 높아진다는 것을 의미합니다(어시스트가 일정하게 유지된다고 가정).
반대로, 어시스트는 계수에 대해 음의 부호를 갖기 때문에 이는 어시스트의 가치를 높이면 선수가 드래프트될 가능성이 감소한다는 것을 의미합니다(포인트가 일정하게 유지된다고 가정).
결과의 p-값은 각 예측 변수가 초안 작성 가능성을 예측하는 데 얼마나 효과적인지에 대한 아이디어도 제공합니다.
- 포인트에 대한 P 값: 0.02
- 어시스트에 대한 P-값: 0.35
포인트는 p-값이 0.05보다 작기 때문에 통계적으로 유의미한 예측 변수로 보이지만 어시스트는 p-값이 0.05보다 작지 않기 때문에 통계적으로 유의하지 않은 것으로 보입니다.
추가 리소스
다음 튜토리얼에서는 Google Sheets에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Google Sheets에서 다항식 회귀를 수행하는 방법
Google 스프레드시트에서 선형 회귀를 수행하는 방법
Google 스프레드시트에서 R 제곱을 계산하는 방법