人口 vs.サンプル標準偏差: それぞれをいつ使用するか
標準偏差は、データセット内の値の分布を測定する最も一般的な方法の 1 つです。
処理しているデータの種類に応じて、計算できる標準偏差には 2 つの異なる種類があることがわかりました。
1. 母集団標準偏差
処理しているデータセットが母集団全体、つまり関心のあるすべての値を表す場合、母集団の標準偏差を計算する必要があります。
母標準偏差の計算式 (σ で示される) は次のとおりです。
σ = √ Σ(x i – μ) 2 / N
金:
- Σ :「和」を意味する記号
- x i : データセット内の i番目の値
- μ : 母集団の平均
- N : 人口規模
2. 標準偏差の例
扱っているデータセットが、より大きな対象母集団から採取されたサンプルを表す場合、サンプルの標準偏差を計算する必要があります。
標本の標準偏差を計算する式はsで示され、次のとおりです。
s = √ Σ(x i – x̄) 2 / (n – 1)
金:
- Σ :「和」を意味する記号
- x i : データセット内の i番目の値
- x̄ : サンプルの意味
- n : サンプルサイズ
サンプルからの母集団の標準偏差: 差
上記の式から、母集団と標本標準偏差の間にはわずかな差があることがわかります。標本標準偏差を計算する際、N ではなく n-1 で除算しました。
それは、標本の標準偏差を計算するとき、母集団の真のばらつきを過小評価してしまう傾向があるからです。言い換えれば、母集団の真の標準偏差の推定値には偏りがあるということです。*
この偏りを修正するには、n-1 で割ります。これにより、標本標準偏差が母集団標準偏差の不偏推定値になることが示されています。
※この証明についてはこの記事の範囲外です。数学的な証明については、 この Stack Exchange の記事を参照してください。
人口 vs.サンプル標準偏差: それぞれをいつ使用するか
次の練習問題を使用すると、母集団と標本の標準偏差をいつ使用する必要があるかをよりよく理解できます。
練習問題 1: スポーツ
バスケットボールのコーチが、チームの 12 人の選手が獲得した得点の平均と標準偏差を要約したいとします。
得点の標準偏差を計算するとき、母集団またはサンプルの標準偏差の式を使用する必要がありますか?
回答: 自チームの選手が獲得したポイントのみに関心があり、他のチームの他の選手には興味がないため、母標準偏差を使用する必要があります。
練習問題 2: 身長
体育教師がクラスの生徒の身長の平均と標準偏差を集計したいとします。
身長の標準偏差を計算するとき、母集団標準偏差式とサンプル標準偏差式のどちらを使用する必要がありますか?
回答: 特定のクラスの生徒数のみに関心があるため、母集団の標準偏差を使用する必要があります。
練習問題 3: 生物学
生物学者が特定の種のカメの体重の平均と標準偏差を要約したいとします。彼女は外に出て、母集団から 20 匹のカメの単純な無作為サンプルを採取することにしました。
重みの標準偏差を計算するとき、母集団またはサンプルの標準偏差式を使用する必要がありますか?
回答: 彼女はサンプル内のカメの重量だけでなく、カメの個体群全体の重量に興味があるため、サンプル標準偏差を使用する必要があります。
練習問題 4: 製造業
検査官が、特定の工場で製造されたタイヤの重量の平均と標準偏差を集計したいとします。彼は、工場から 40 本のタイヤの単純な無作為サンプルを採取し、それぞれの重量を測定することにしました。
重みの標準偏差を計算するとき、母集団またはサンプルの標準偏差式を使用する必要がありますか?
回答:サンプルのタイヤの重量だけではなく、その工場で生産されるすべてのタイヤの重量に興味があるため、サンプルの標準偏差を使用する必要があります。
追加リソース
次のチュートリアルでは、標準偏差に関する追加情報を提供します。
標準偏差が重要なのはなぜですか?
適切な標準偏差とはどれくらいだと考えられますか?
実生活における標準偏差の使用例 6 例
変動係数と標準偏差: 差