데이터 추세를 제거하는 방법: 예제 포함


시계열 데이터의 “추세 제거”는 데이터의 기본 추세를 제거하는 것을 의미합니다. 우리가 이를 원하는 주된 이유는 계절적 또는 주기적 데이터의 기본 추세를 보다 쉽게 시각화하는 것입니다.

예를 들어, 연속 20개 기간 동안 회사의 총 매출을 나타내는 다음 시계열 데이터를 고려해 보세요.

시계열 데이터 확장

분명히 매출은 시간이 지남에 따라 증가하는 경향이 있지만, 시간이 지남에 따라 발생하는 작은 “언덕”에서 알 수 있듯이 데이터에는 순환적 또는 계절적 추세도 있는 것으로 보입니다.

이러한 순환 추세를 더 잘 파악하기 위해 데이터를 축소할 수 있습니다. 이 경우 결과 데이터가 순환 추세만 나타내도록 시간 경과에 따른 전반적인 상승 추세를 제거하는 작업이 포함됩니다.

추세가 제거된 시계열 데이터의 예

시계열 데이터를 축소하는 데 사용되는 두 가지 일반적인 방법이 있습니다.

1. 차별화 경향

2. 모델 피팅에 의한 열화

이 튜토리얼에서는 각 방법에 대해 간략하게 설명합니다.

방법 1: 차별화를 통한 완화

시계열 데이터의 추세를 제거하는 한 가지 방법은 각 관측값이 이전 관측값과의 차이를 나타내는 새 데이터 세트를 만드는 것입니다.

예를 들어, 다음 이미지는 차별화를 사용하여 데이터 계열의 추세를 제거하는 방법을 보여줍니다.

추세 제거된 시계열 데이터의 첫 번째 값을 얻으려면 13 – 8 = 5를 계산합니다. 그런 다음 다음 값을 얻으려면 18-13 = 5를 계산합니다.

시계열 데이터를 차별화하여 확장

다음 차트는 원래 시계열 데이터를 보여줍니다.

시계열 데이터 확장

이 차트는 추세가 없는 데이터를 보여줍니다.

추세가 제거된 시계열 데이터의 예

전체적인 상승 추세가 제거되었기 때문에 이 차트의 시계열 데이터에서 계절적 추세를 확인하는 것이 얼마나 쉬운지 확인하세요.

방법 2: 모델 피팅에 의한 저하

시계열 데이터의 추세를 제거하는 또 다른 방법은 회귀 모델을 데이터에 맞춘 다음 관찰된 값과 모델의 예측 값 간의 차이를 계산하는 것입니다.

예를 들어, 동일한 데이터 세트가 있다고 가정해 보겠습니다.

단순 선형 회귀 모델을 데이터에 맞추면 데이터 세트의 각 관측값 에 대한 예측 값을 얻을 수 있습니다.

그런 다음 각 관측값에 대한 실제 값과 예측 값 간의 차이를 찾을 수 있습니다. 이러한 차이는 추세가 제거된 데이터를 나타냅니다.

모델 피팅을 통한 데이터 추세 제거

추세 없이 데이터 그래프를 생성하면 데이터의 계절적 또는 순환적 추세를 훨씬 더 쉽게 시각화할 수 있습니다.

이 예에서는 선형 회귀를 사용했지만 데이터에 지수 상승 또는 하락 추세가 더 많이 있는 경우 지수 회귀 와 같은 더 복잡한 방법을 사용할 수 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다