サンプルサイズ

によるベンジャミン・アンダーソン博士 8月 3, 2023 統計 0コメント

この記事では、サンプルサイズとは何か、そしてそれが統計においてなぜ重要なのかについて説明します。さらに、適切なサンプルサイズを計算する方法と、それがどのように行われるかを確認できるように解決された演習を確認します。

サンプルサイズはどれくらいですか?

サンプルサイズ(またはサンプルサイズ) は、研究のサンプルを構成する個人の数です。統計では、サンプルが母集団全体を代表するようにサンプルサイズが重要です。

したがって、統計研究のサンプルサイズは、母集団全体の特性を表すのに十分な大きさでなければなりません。一方で、研究の費用が高くなるため、サンプルサイズを過度に大きくすることはできません。結論として、サンプルサイズは大きすぎても小さすぎてもならず、適切である必要があります。

たとえば、国の標高を分析したい場合、その国の全住民の身長を尋ねることはできません。調査には時間がかかり、費用もかかりすぎるからです。したがって、無作為抽出を実施し、母集団の代表的なサンプルのみにインタビューする必要があります。

➤参照:サンプリングの種類

そして、適切なサンプルサイズはどうやって知ることができるのでしょうか?次のセクションでは、調査要件に基づいて適切なサンプルサイズを決定する方法を見ていきます。

サンプルサイズの計算方法

平均値を推定するために必要なサンプルサイズは、Z の 2 乗_α/2に標準偏差 (σ) を乗算し、必要な誤差の範囲 (e) で除算したものに等しくなります。したがって、サンプルサイズを計算する式は次のようになります。

$\displaystyle n=\left(\frac{Z_{\alpha/2}\cdot\sigma}{e}\right)^2$

金：

$n$

はサンプルサイズです。
$\alpha$

望ましい重要度レベルです。これを考慮すると

$1-\alpha$

は望ましい信頼レベルです。
$Z_{\alpha/2}$

α/2 の確率に対応する標準正規分布の分位数です。サンプルサイズが大きく、95% の信頼水準の場合は通常 1.96 に近く、99% の信頼水準の場合は通常 2.576 に近くなります。
$\sigma$

は標準偏差です。

この式では、母集団のサイズが無限である、つまり母集団のサイズが非常に大きいか未知であると想定されていることに注意してください。

注:上の式は、平均の信頼式区間から導出されています。

サンプルサイズの計算例

このセクションでは、例として統計調査に適したサンプルサイズを計算します。

母集団の標準偏差が約 15 であることはわかっていますが、その平均値はわからないため、平均値を推定する研究を実行したいと考えています。信頼水準 95% で誤差範囲 ±2 が必要な場合、サンプルサイズはどれくらい必要ですか?

上で見たように、サンプルサイズを計算する式は次のとおりです。

$\displaystyle n=\left(\frac{Z_{\alpha/2}\cdot\sigma}{e}\right)^2$

この場合、望ましい信頼水準は 95% であるため、対応する Z _α/2値は 1.96 になります。

$1-\alpha=0,95 \ \color{orange}\bm{\longrightarrow}\color{black} \ \alpha=0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \alpha/2=0,025$

$\begin{array}{c}Z_{\alpha/2}= \ \color{orange}\bm{?}\\[4ex]Z_{0,025}=1,96\end{array}$

➤参照:信頼水準値の表

最後に、すべてのパラメーターの価値がわかったので、それらの値を式に代入してサンプルサイズを計算します。

$\begin{aligned}\displaystyle n&=\left(\frac{Z_{\alpha/2}\cdot\sigma}{e}\right)^2\\[2ex] n&=\left(\frac{1,96\cdot 15}{2}\right)^2\\[2ex] n&=216,09 \approx 217 \end{array}$

つまり、望ましい要件で母集団平均を推定するには、少なくとも 217 人のサンプルが必要です。

サンプルサイズ、信頼水準、誤差の範囲

必要な信頼レベルと許容誤差に応じて、必要なサンプルサイズは異なります。したがって、サンプルサイズ、信頼水準、誤差範囲は次のように関係します。

サンプルサイズと信頼水準は正比例します。つまり、信頼水準が増加すると、サンプルサイズも増加します。
サンプルサイズと誤差の範囲は反比例します。したがって、誤差の範囲が増加すると、サンプルサイズは減少します。
したがって、サンプルサイズを増やすと、信頼水準が向上したり、誤差の範囲が減少したりする可能性があります。

その他のサンプルサイズの計算式

推定するパラメータに応じて、必要なサンプルサイズの計算式は若干異なります。したがって、このセクションでは、いくつかの特殊なケースでサンプルサイズを計算するのに役立つ他の式を見ていきます。

割合のサンプルサイズ

割合 (p) を推定するために必要なサンプルサイズを計算する式は次のとおりです。

$n=\cfrac{N\cdot Z_{\alpha/2}^2\cdot p\cdot (1-p)}{e^2\cdot (N-1)+Z_{\alpha/2}^2\cdot p\cdot (1-p)}$

確率のサンプルサイズ

確率を推定する場合は、次の式を使用して必要なサンプルサイズを決定することをお勧めします。

$\displaystyle n=\left(\frac{Z_{\alpha/2}}{2\cdot e}\right)^2$

2 つの独立した平均値を比較するためのサンプルサイズ

与えられた α リスクおよび β リスクで 2 つの独立した平均を比較する場合のサンプルサイズを計算する式は次のとおりです。

$n=\cfrac{2\cdot \sigma^2 \cdot \left(Z_{\alpha/2}+Z_\beta\right)}{\Delta^2}$

金

$\Delta$

対立仮説の 2 つの平均の差です。

2つの一対の平均を比較するためのサンプルサイズ

固定誤差 α と誤差 β を持つ 2 つの一対の平均を比較する場合、サンプル内の観測値の数を見つけるために使用する式は次のとおりです。

$n=\cfrac{2\cdot \sigma_d^2 \cdot \left(Z_{\alpha/2}+Z_\beta\right)}{\Delta^2}$

金

$\Delta$

対立仮説の 2 つの一対の平均の差です。

$\sigma_d^2$

これは、同じ個人の 2 つの測定値間の差の分散です。

著者について

ベンジャミン・アンダーソン博士

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る