内挿または外挿: 違いは何ですか?
学生が統計学でよく混同する 2 つの用語は、内挿と外挿です。
違いは次のとおりです。
内挿とは、データ ポイントの範囲内にある値を予測することを指します。
外挿とは、データ ポイントの範囲外にある値を予測することを指します。
次の例は、2 つの用語の違いを示しています。
例: 内挿と外挿
次のデータセットがあるとします。
単純な線形回帰モデルを次の点に当てはめることを決定できます。
次に、近似回帰モデルを使用して、データ ポイントの範囲内と範囲外の両方のポイント値を予測できます。
近似回帰モデルを使用して、既存のデータ ポイント範囲内のポイント値を予測することを内挿と呼びます。
逆に、近似回帰モデルを使用して既存の範囲外のポイント値を予測する場合、それは外挿と呼ばれます。
外挿の潜在的な危険性
外挿するときは、データ ポイントの現在の範囲内に存在するのと同じパターンが範囲外にも存在すると想定します。
ただし、現在のデータ ポイントの範囲外に存在するパターンは大きく異なる可能性があるため、これは危険な仮定である可能性があります。
このため、回帰モデルの作成に使用された値の範囲外にあるデータ ポイント値を予測するために外挿を使用することは危険な場合があります。
実際には、既存の値の範囲からわずかに外れるポイント値を予測するために外挿を使用することが理にかなっていることがよくありますが、範囲から離れるほど、予測値と実際の値の差が大きくなる可能性が高くなります。価値観が重要です。 。
外挿を使用する場合
外挿が合理的なアイデアであるかどうかを判断するには、多くの場合、ドメイン固有の専門知識が必要です。
たとえば、企業のマーケティング部門が、広告支出を予測変数、総収益を応答変数として使用する単純な線形回帰モデルを適用するとします。
このシナリオでは、広告支出の着実な増加により総収益が予測どおり増加すると仮定するのが合理的かもしれません。
このシナリオでは、値を推定する能力にかなり自信を持って言えます。
ただし、生物学者が植物の成長を予測するために全肥料を使用したいというシナリオを考えてみましょう。
彼女は単純な線形回帰モデルをデータ ポイントに当てはめることを決定するかもしれませんが、植物の高さには上限があるため、ポイント値を予測するために外挿を使用することはおそらく意味がありません。値の範囲外です。モデルに適合させるために使用される値:
このシナリオでは、値を推定する能力にかなり自信がなくなる可能性があります。
要点: 外挿は、一部の領域では他の領域よりも理にかなっている可能性がありますが、モデルの適合に使用される値の範囲内に存在するモデルがビーチの外には存在しないという潜在的な危険が常に存在します。