データの傾向を除去する方法: 例付き
時系列データの「トレンド除去」とは、データの根本的な傾向を除去することを意味します。これを行う主な理由は、季節的または周期的なデータの根本的な傾向をより簡単に視覚化するためです。
たとえば、連続 20 期間の企業の総売上高を表す次の時系列データについて考えてみましょう。
明らかに、売上は時間の経過とともに増加する傾向がありますが、時間の経過とともに発生する小さな「山」によって証明されるように、データには周期的または季節的な傾向もあるようです。
この循環傾向をよりよく把握するために、データを圧縮することができます。この場合、結果として得られるデータが周期的傾向のみを表すように、時間の経過に伴う全体的な上昇傾向を除去することが含まれます。
時系列データを圧縮するために使用される一般的な方法が 2 つあります。
1. 差別化による傾向
2. モデルフィッティングによる劣化
このチュートリアルでは、各方法について簡単に説明します。
方法 1: 微分による緩和
時系列データの傾向を除去する 1 つの方法は、各観測値がそれ自体と前の観測値との差を表す新しいデータ セットを単純に作成することです。
たとえば、次の図は、微分を使用してデータ シリーズの傾向を除去する方法を示しています。
トレンド除去された時系列データの最初の値を取得するには、13 – 8 = 5 を計算します。次に、次の値を取得するには、18-13 = 5 を計算します。
次のグラフは、元の時系列データを示しています。
そして、このグラフは傾向のないデータを示しています。
このグラフでは、全体的な上昇傾向が削除されているため、時系列データの季節的傾向が非常に見やすくなっていることに注目してください。
方法 2: モデル フィッティングによる劣化
時系列データの傾向を除去するもう 1 つの方法は、回帰モデルをデータに当てはめて、観測値とモデルの予測値の差を計算することです。
たとえば、同じデータセットがあるとします。
単純な線形回帰モデルをデータに当てはめると、データセット内の各観測値の予測値を取得できます。
次に、各観測値の実際の値と予測値の差を見つけることができます。これらの違いは、トレンド除去されたデータを表します。
傾向のないデータのグラフを作成すると、データの季節的または周期的な傾向をより簡単に視覚化できます。
この例では線形回帰を使用しましたが、データに指数関数的な上昇または下降傾向がある場合は、指数回帰などのより複雑な方法を使用することも可能であることに注意してください。