適切な標準偏差とはどれくらいだと考えられますか?
標準偏差は、サンプル内の値の分布を測定するために使用されます。
次の式を使用して、特定のサンプルの標準偏差を計算できます。
√ Σ(x i – x bar ) 2 / (n-1)
金:
- Σ: 「和」を意味する記号
- x i :サンプルのi 番目の値
- x bar :サンプルの平均値
- n:サンプルサイズ
標準偏差値が高いほど、 サンプル内での値の分散が大きくなります。逆に、標準偏差値が低いほど、値はより密接にクラスター化されます。
学生がよく尋ねる質問は、「標準偏差の適切な値はどれくらいだと考えられますか?」というものです。
答え:標準偏差は単にサンプル内の値の分布を示すものであるため、標準偏差は「良い」または「悪い」ということはできません。
また、標準偏差が「高い」か「低い」かを決定するための普遍的な数値もありません。たとえば、次のシナリオを考えてみましょう。
シナリオ 1:不動産業者が自分の町の 100 軒の住宅の価格データを収集したところ、価格の標準偏差が 12,000 ドルであることがわかりました。
シナリオ 2 : 経済学者が米国 50 州で徴収された所得税の合計を測定し、徴収された所得税の合計の標準偏差が 480,000 ドルであることを発見しました。
シナリオ 2 の標準偏差はシナリオ 1 の標準偏差よりもはるかに高くなりますが、州によって徴収される税金の合計が明らかに不動産価格よりもはるかに高いため、シナリオ 2 で測定される単位ははるかに高くなります。
これは、標準偏差が「良い」か「悪い」か、さらには「高い」か「低い」かを判断するために使用できる単一の数値は存在しないことを意味します。標準偏差は状況によって異なるためです。
変動係数を使用する
標準偏差が高いかどうかを判断する 1 つの方法は、標準偏差をデータセットの平均と比較することです。
変動係数 は、 CVと略されることが多く、平均に対するデータセット内の値の広がりを測定する方法です。次のように計算されます。
CV = s/ x
金:
- s:データセットの標準偏差
- x :データセットの平均
簡単に言えば、CV は平均に対する標準偏差の比率です。
CV が高くなるほど、平均からの標準偏差も高くなります。一般に、CV 値が 1 より大きい場合、高いとみなされます。
たとえば、不動産業者が町内の 100 軒の住宅の価格データを収集し、平均価格が 150,000 ドルで、価格の標準偏差が 12,000 ドルであることが判明したとします。 CV は次のように計算されます。
- CV: 12,000 ドル / 150,000 ドル = 0.08
この CV 値は 1 よりもはるかに小さいため、データの標準偏差がかなり低いことがわかります。
逆に、経済学者が米国 50 州で徴収された所得税の総額を測定し、標本平均が 400,000 ドル、標準偏差が 480,000 ドルであることが判明したとします。 CV は次のように計算されます。
- 履歴書: 480,000 ドル / 400,000 ドル = 1.2
この CV 値は 1 より大きいため、データ値の標準偏差が非常に高いことがわかります。
データセット間の標準偏差の比較
さまざまなデータセットにわたる値の分布を測定するために標準偏差をよく使用します。
たとえば、教授が学生に 1 学期中に 3 回の試験を課したとします。次に、各試験のスコアの標準偏差を計算します。
- 試験結果の標準偏差の例 1: 4.6
- 試験結果の標準偏差の例 2: 12.4
- 試験結果の標準偏差の例3: 2.3
これにより、教授は、試験結果が試験 2 で最も分散しており、試験 3 で最も密集していることがわかります。