何が良い残差プロット、または悪い残差プロットとみなされるのでしょうか?
回帰分析における残差プロットは、x 軸に回帰モデルの近似値を表示し、y 軸に沿ってモデルの残差を表示するプロットの一種です。
残りのレイアウトを視覚的に検査する場合、通常、レイアウトが「良い」か「悪い」かを判断するために次の 2 つの点を調べます。
1. 残差は明確な傾向を示していますか?
- 「良好な」残差プロットでは、残差は明確な傾向を示しません。
- 「悪い」残差プロットでは、残差は曲線や波などの何らかのパターンを持ちます。これは、使用した回帰モデルがデータに適切に適合していないことを示しています。
2. 残差の分散は体系的に増加または減少していますか?
- 「良好な」残差プロットでは、残差は分散が系統的に増加または減少することなく、ゼロの周囲にランダムに分散しています。
- 「悪い」残差プロットでは、残差の分散が系統的に増加または減少します。
残差プロットが「良好」と評価された場合、回帰モデルの結果が信頼でき、モデル係数を安全に解釈できることを意味します。
ただし、残差プロットが「悪い」と評価された場合は、モデルの結果が信頼できないことを意味し、別の回帰モデルをデータに適合させる必要があります。
次の例では、実際に「良い」残差プロットと「悪い」残差プロットを解釈する方法を説明します。
例 1: 「良好な」残留痕跡
回帰モデルを当てはめて、次の残差プロットが得られたとします。
これが「良好な」残差プロットであるかどうかを判断するには、次の 2 つの質問に答えることができます。
1. 残差は明確な傾向を示していますか?
いいえ。残差はゼロの周りにランダムに散在しており、明確なパターンはありません。
2. 残差の分散は体系的に増加または減少していますか?
いいえ。残差は、近似値の各レベルでほぼ一定の分散 (つまり、残差とゼロ値の間の距離) を持ちます。
これらの質問の両方に「いいえ」と答えたので、これは「良好な」残差プロットであると考えられます。
したがって、回帰モデルの結果を信頼し、モデル係数を安全に解釈できます。
例 2: 明確なモデルを備えた「悪い」残差プロット
回帰モデルを当てはめて、次の残差プロットが得られたとします。
これが「良好な」残差プロットであるかどうかを判断するには、次の 2 つの質問に答えることができます。
1. 残差は明確な傾向を示していますか?
はい。残基は湾曲したパターンを示します。
2. 残差の分散は体系的に増加または減少していますか?
はい。残差は、近似値の異なるレベルで異なるレベルの分散を持ちます。
これらの質問の少なくとも 1 つに対して「はい」と答えたので、これは「悪い」残差プロットであると考えられます。
これは、回帰モデルがデータに適切に適合していないことを意味します。
特に、残差プロットの曲線パターンは、線形回帰モデルがデータに適合できず、二次回帰モデルの方が適切に機能する可能性が高いことを示しています。
例 3: 分散が増加する「悪い」残差プロット
回帰モデルを当てはめて、次の残差プロットが得られたとします。
これが「良好な」残差プロットであるかどうかを判断するには、次の 2 つの質問に答えることができます。
1. 残差は明確な傾向を示していますか?
いいえ、残差には明確な傾向はありません。
2. 残差の分散は体系的に増加または減少していますか?
はい。近似値が増加するにつれて、残差の分散も増加します。
これらの質問の少なくとも 1 つに対して「はい」と答えたので、これは「悪い」残差プロットであると考えられます。
この特定の例では、残差は不均一分散性の影響を受けます。これは、近似値のさまざまなレベルでの残差の不等分散を指します。
これは、回帰モデルの結果が信頼できない可能性があることを意味します。
回帰モデルの不均一分散の問題を解決するさまざまな方法については、この記事を参照してください。
追加リソース
次のチュートリアルでは、さまざまな統計ソフトウェアを使用して残差プロットを作成する方法を説明します。
R で残差プロットを作成する方法
Python で残差プロットを作成する方法
Excel で残差プロットを作成する方法
SAS で残差プロットを作成する方法