中心極限定理:満たすべき4つの条件
中心極限定理は、たとえ母集団の分布が正規でなくても、サンプルサイズが十分に大きければ標本平均の標本分布はほぼ正規になるということです。
中心極限定理を適用するには、次の 4 つの条件を満たす必要があります。
1.ランダム化: 母集団の各メンバーがサンプルの一部として選択される確率が等しいように、データはランダムにサンプリングされる必要があります。
2. 独立性:サンプルの値は互いに独立している必要があります。
3. 10% の条件:サンプルを非復元で抽出する場合、サンプル サイズは母集団の 10% を超えてはなりません。
4. 大きなサンプル条件:サンプル サイズは十分に大きい必要があります。
このチュートリアルでは、各条件について簡単に説明します。
条件 1: ランダム化
中心極限定理を適用するには、使用するデータは確率サンプリング法を使用して母集団からランダムに抽出する必要があります。
統計では、次の 2 種類の サンプリング方法があります。
1. 確率抽出法:母集団の各メンバーがサンプルの一部として選択される確率が等しい抽出法。例としては次のものが挙げられます。
- 単純なランダムサンプル
- 層別ランダムサンプル
- クラスター化されたランダムサンプル
- 体系的なランダムサンプリング
2. 非確率サンプリング法:母集団の各メンバーがサンプルの一部として選択される確率が同じではないサンプリング法。例としては次のものが挙げられます。
確率サンプリング法を使用してサンプルを取得することが重要です。これにより、母集団の代表的なサンプルを取得する可能性が最大化されます。
条件2:独立性
中心極限定理を適用するには、サンプル内の各値が互いに独立していると仮定する必要もあります。言い換えれば、あるイベントの発生は別のイベントの発生に影響を与えません。
確率サンプリング法を使用すると、この種のサンプリング法がサンプルに含める観測値を互いに完全に独立して選択するため、この仮定は多くの場合満たされます。
条件 3: 10% 条件
サンプルが非復元で抽出される場合 (これはほとんどの場合に当てはまります)、サンプル サイズは母集団全体の 10% を超えてはなりません。
例えば:
- 母集団のサイズが 500 人の場合、サンプル サイズは 50 人を超えてはなりません。
- 母集団のサイズが 1,000 人の場合、サンプルは 100 人を超えてはなりません。
- 母集団のサイズが 50,000 人の場合、サンプル サイズは 5,000 人を超えてはなりません。
等々。
条件4: 大量サンプル条件
最後に、中心極限定理を適用するには、サンプル サイズが十分に大きくなければなりません。
一般に、「十分な大きさ」とは 30 以上であると考えられます。ただし、この数値は人口分布の基本的な形状に応じて若干異なる場合があります。
特に:
- 母集団の分布が対称的である場合、サンプル サイズが 15 程度で十分な場合があります。
- 母集団の分布が偏っている場合、通常は少なくとも 30 人のサンプルが必要です。
- 人口分布が極端に偏っている場合は、40 人以上のサンプルが必要になる場合があります。
母集団の分布の形状に応じて、中心極限定理を適用するにはサンプル サイズが 30 より大きいか小さい必要がある場合があります。