サンプリングのばらつきとは何ですか?定義と例
統計では、次のような質問に答えたいことがよくあります。
- 特定の州の平均世帯収入はいくらですか?
- 特定の種のカメの平均体重はどれくらいですか?
- 大学フットボールの試合の平均入場者数はどれくらいですか?
各シナリオでは、測定したいすべての考えられる個々の要素を表す母集団に関する質問に答えたいと考えています。
ただし、母集団内の各個人に関するデータを収集するのではなく、母集団全体の一部を表す母集団のサンプルに関するデータを収集します。
たとえば、合計 800 匹のカメがいる特定の種類のカメの平均体重を知りたい場合があります。
集団内のすべてのカメを見つけて体重を量るには時間がかかりすぎるため、代わりに 30 匹のカメの 単純なランダムサンプルを収集し、体重を量ります。
次に、このカメのサンプルの平均体重を使用して、母集団内のすべてのカメの平均体重を推定できます。
標本変動とは、平均がサンプルごとに異なるという事実を指します。
たとえば、30 匹のカメからなる無作為サンプルでは、サンプル平均が 350 ポンドになる可能性があります。別のランダムなサンプルでは、サンプルの平均値は 345 ポンドになる可能性があります。さらに別のサンプルでは、サンプルの平均は 355 ポンドになる可能性があります。
サンプル平均値にはばらつきがあります。
サンプリングのばらつきを測定する方法
実際には、母集団パラメータを推定するために収集するサンプルは 1 つだけです。たとえば、30 匹のウミガメのサンプルを 1 つだけ収集して、カメの個体群全体の平均体重を推定します。
これは、1 つの標本平均 ( x ) のみを計算し、それを母集団平均 (μ) の推定に使用することを意味します。
サンプル平均 = x
しかし、サンプルの平均値はサンプルごとに異なることがわかっています。したがって、この変動を考慮するために、次の式を使用してサンプル平均の標準偏差を推定できます。
サンプル平均の標準偏差 = s/ √n
金:
- s:サンプルの標準偏差
- n:サンプルサイズ
たとえば、30 匹のウミガメのサンプルを収集し、サンプルの平均体重が 350 ポンド、サンプルの標準偏差が 12 ポンドであることが判明したとします。これらの数値に基づいて、次のように計算します。
サンプル平均 = 350 冊
サンプル平均の標準偏差 = 12 / √ 30 = 2.19 ポンド
これは、すべてのカメの真の母集団平均体重の最良の推定値は 350 ポンドですが、サンプル平均は約 2.19 ポンドの標準偏差で変化すると予想されることを意味します。
標本平均の標準偏差の興味深い特性は、標本サイズを大きくすると自然に標準偏差が小さくなるということです。
たとえば、100 匹のウミガメのサンプルを収集し、サンプルの平均体重が 350 ポンド、サンプルの標準偏差が 12 ポンドであることが判明したとします。サンプル平均の標準偏差は次のように計算されます。
サンプル平均の標準偏差 = 12 / √ 100 = 1.2 ポンド
サンプル平均の最良の推定値は依然として 350 ポンドですが、100 匹のウミガメのサンプルから 100 匹のウミガメの次のサンプルまでの平均値は、1 標準偏差がわずか 1.2 ポンドだけ変動すると予想できます。
言い換えれば、サンプルサイズが大きくなると、サンプル平均間のばらつきが小さくなります。