絶対平均偏差と標準偏差: 違いは何ですか?
標準偏差は、データセットの広がりを測定する最も一般的な方法の 1 つです。
次のように計算されます。
標準偏差 = √( Σ(x i – x ) 2 / n )
データセット内の観測値の分布を測定するもう 1 つの方法は、平均絶対偏差です。
次のように計算されます。
平均絶対偏差 = Σ|x i – x | /ない
このチュートリアルでは、これら 2 つの指標の違いと、それぞれの計算方法の例を説明します。
類似点と相違点
名前が示すように、標準偏差と平均絶対偏差は、特定のデータセット内の平均からの観測値の典型的な偏差を定量化しようとします。
ただし、各メトリクスで使用される方法は異なります。
標準偏差
標準偏差は、各観測値とデータセットの平均値の間の二乗差を求めます。次に、これらの二乗の差を平均し、平方根を求めます。
これにより、「標準」、つまり平均からの観測値の典型的な偏差を表す数値が得られます。
絶対偏差を意味します
逆に、平均絶対偏差は、各観測値とデータセットの平均の間の絶対偏差を求めます。次に、これらの偏差の平均を求めます。
これにより、平均からの観測値の平均偏差を表す数値が得られます。
標準偏差は差の二乗を求めるため、常に平均絶対偏差以上になります。
極端な外れ値が存在する場合、標準偏差は平均絶対偏差よりもかなり大きくなります。次の例は、この点を示しています。
例: 標準偏差からの平均絶対偏差
次の 8 つの値のデータ セットがあるとします。
平均は11であることがわかります。
したがって、平均絶対偏差は次のように計算されます。
平均絶対偏差= (|3-11| + |5-11| + |6-11| + |8-11| + |11-11| + |14-11| + |17-11| + |24- 11|) / 8 = 5.5 。
そして、次のように標準偏差を計算します。
標準偏差 = √((3-11) 2 + (5-11) 2 + (6-11) 2 + (8-11) 2 + (11-11) 2 + (14-11) 2 + (17- 11) 2 + (24-11) 2 )/8) = 6.595 。
前述したように、標準偏差は常に平均絶対偏差以上になります。
ただし、データセットに極端な外れ値がある場合、標準偏差と平均絶対偏差の差は特に大きくなります。
たとえば、最後の値に極端な外れ値がある次のデータセットを考えてみましょう。
このデータセットの標準偏差は63.27で、平均絶対偏差は41.75であることがわかります。
極端な外れ値により、標準偏差が平均絶対偏差よりも大幅に大きくなります。