추론과 예측: 차이점은 무엇인가요?


통계에서 우리는 다음 두 가지 이유 중 하나로 데이터를 사용하려는 경우가 많습니다.

(1) 추론: 우리는 기존 데이터 세트에서 예측 변수와 응답 변수 간의 관계 특성을 이해하려고 합니다.

(2) 예측: 기존 데이터 세트를 사용하여 새로운 관찰의 응답 변수 값을 예측하는 모델을 구축하려고 합니다.

예를 들어 주택에 대한 정보가 포함된 다음 데이터세트가 있다고 가정해 보겠습니다.

추론의 예:

면적, 침실 수, 욕실 수를 예측 변수로 사용하고 가격을 응답 변수로 사용하여 다중 선형 회귀 모델을 구축한다고 가정합니다.

그런 다음 회귀 계수를 사용하여 각 예측 변수의 1단위 변화와 관련된 가격의 평균 변화를 이해할 수 있습니다.

예를 들어, 침실이 추가되고, 욕실이 추가되고, 평방피트가 추가될 때마다 가격이 평균적으로 얼마나 변하는지 이해할 수 있습니다.

예측의 예:

동일한 다중 선형 회귀 모델을 구축하고 이를 사용하여 면적, 침실 수, 욕실 수를 기반으로 새 주택의 가치를 예측할 수 있습니다.

예를 들어, 모델을 사용하여 침실 3개, 욕실 3개, 면적 2,000평방피트를 갖춘 새 주택의 가격을 예측할 수 있습니다.

그런 다음 우리의 예측을 실제 리스팅 가격과 비교하고 주택이 과소평가되거나 과대평가되어 나타나는지 여부를 평가할 수 있습니다.

다음 예는 다양한 시나리오에서 추론과 예측의 차이점을 보여줍니다.

예시 1: 스포츠의 추론과 예측

프로 농구팀에 대한 정보가 포함된 다음 데이터세트가 있다고 가정해 보겠습니다.

추론의 예:

포인트, 리바운드, 어시스트를 예측 변수로 사용하고 승리를 응답 변수로 사용하여 다중 선형 회귀 모델을 구축한다고 가정합니다.

그런 다음 모델을 사용하여 각 추가 점수, 리바운드 및 어시스트에 따라 승리 수가 (평균적으로) 얼마나 변하는지 이해할 수 있습니다.

예측의 예:

동일한 다중 선형 회귀 모델을 구축하고 이를 사용하여 팀의 득점, 리바운드 및 어시스트 수를 기반으로 팀이 얻을 수 있는 승리 수를 예측할 수 있습니다.

예를 들어, 이 모델을 사용하여 90득점, 40리바운드, 30어시스트를 보유한 팀이 얼마나 많은 승리를 거둘지 예측할 수 있습니다.

예시 2: 비즈니스에서의 추론과 예측

다양한 회사의 연간 수익(수백만 단위)에 대한 정보가 포함된 다음 데이터 세트가 있다고 가정합니다.

추론의 예:

광고 지출, 직원 수, 총 인수를 예측 변수로 사용하고 연간 수익을 응답 변수로 사용하여 다중 선형 회귀 모델을 구축한다고 가정합니다.

그런 다음 모델을 사용하여 광고에 지출된 추가 비용, 직원 추가, 추가 인수에 따른 총 연간 수익 변화(평균)가 얼마나 되는지 이해할 수 있습니다.

예측의 예:

동일한 다중 선형 회귀 모델을 구축하고 이를 사용하여 총 마케팅 지출, 직원 수 및 총 인수를 기반으로 회사의 연간 수익을 예측할 수 있습니다.

예를 들어, 이 모델을 사용하여 광고에 2,500만 달러를 지출하고 직원이 40명이며 인수가 2건인 회사의 연간 수익을 예측할 수 있습니다.

추가 리소스

다음 자습서에서는 통계에서 이해해야 할 중요한 용어에 대한 추가 정보를 제공합니다.

기술통계 또는 추론통계: 차이점은 무엇인가요?
측정 수준: 명목, 순서, 간격 및 비율
질적 변수와 양적 변수: 차이점은 무엇인가요?

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다