範囲 vs.標準偏差: それぞれをいつ使用するか
範囲と標準偏差は、データセット内の値の分布を測定する 2 つの方法です。
範囲は、データセット内の最小値と最大値の差を表します。
標準偏差は、平均値からの個々の値の典型的な偏差を測定します。次のように計算されます。
s = √(Σ(x i – x ) 2 / (n-1))
金:
- Σ: 「和」を意味する記号
- x i :サンプル内のi番目の観測値
- x :サンプルの意味
- n:サンプルサイズ
たとえば、次のデータセットがあるとします。
データセット: 1、4、8、11、13、17、19、19、20、23、24、24、25、28、29、31、32
範囲は31 -1 = 32 として計算されます。
計算機を使用すると、標準偏差が 9.25 であることがわかります。
範囲と標準偏差: 類似点と相違点
範囲と標準偏差には次の類似点があります。
- どちらのメトリクスも、データセット内の値の分布を測定します。
ただし、範囲と標準偏差には次の違いがあります。
- 範囲は、データセット内の最大値と最小値の差を示します。
- 標準偏差は、データセットの平均値からの個々の値の典型的な偏差を示します。
範囲 vs.標準偏差: それぞれをいつ使用するか
データセット内の最大値と最小値の違いを理解したい場合は、 rangeを使用する必要があります。
たとえば、教授が 100 人の学生に試験を行うとします。彼女はスケールを使用して、クラスのすべての生徒が達成した最高点と最低点の差を理解できます。
逆に、データセットの典型的な値が平均値からどの程度離れているかを理解したい場合には、標準偏差を使用する必要があります。
たとえば、教授が 100 人の学生に試験を実施する場合、標準偏差を使用して、標準的な試験のスコアが試験の平均スコアからどの程度乖離しているかを定量化できます。
データセット内の値の分布を記述するために範囲を使用するか標準偏差を使用するかを選択する必要がないことは注目に値します。両方の指標はまったく異なる情報を提供するため、両方の指標を使用できます。
範囲と標準偏差の欠点
範囲と標準偏差には両方とも外れ値の影響を受けるという欠点があります。
これを説明するために、次のデータセットを考えてみましょう。
データセット: 1、4、8、11、13、17、19、19、20、23、24、24、25、28、29、31、32
このデータセットの範囲と標準偏差については、次の値を計算できます。
- 範囲: 31
- 標準偏差: 9.25
ただし、データセットに極端な外れ値が含まれているかどうかを考慮してください。
データセット: 1、4、8、11、13、17、19、19、20、23、24、24、25、28、29、31、32、378
計算機を使用して、このデータセットの次のメトリクスを見つけることができます。
- 範囲: 377
- 標準偏差: 85.02
外れ値により範囲と標準偏差がどのように大きく変化するかに注目してください。
範囲と標準偏差は、データ セット内の値の分布を把握するのに役立つ尺度ですが、まず、これらの値に影響を与える外れ値がデータ セットに含まれていないことを確認する必要があります。対策。そうしないと、範囲と標準偏差が誤解を招く可能性があります。