中心極限定理: 定義 + 例


中心極限定理は、たとえ母集団の分布が正規でなくても、サンプルサイズが十分に大きければ標本平均の標本分布はほぼ正規になるということです。

中心極限定理は、標本分布が次の特性を持つことも示しています。

1.標本分布の平均は母集団分布の平均と等しくなります。

x = μ

2.標本分布の分散は、母集団分布の分散を標本サイズで割ったものに等しくなります。

s2 = σ2 /n

中心極限定理の例

ここでは、中心極限定理を実際に説明するための例をいくつか示します。

均一分布

カメの甲羅の幅が最小幅 2 インチ、最大幅 6 インチの一様分布に従っていると仮定します。つまり、カメを無作為に選択し、その甲羅の幅を測定すると、幅は 2 ~ 6 インチになる可能性が高くなります。

亀の甲羅の幅の分布を表すヒストグラムを作成すると、次のようになります。

中心極限定理の一様分布の例
一様分布の平均はμ = (b+a) / 2 です。ここで、 bは可能な最大値、 aは可能な最小値です。この場合、(6+2) / 2 = 4 となります。

一様分布の分散はσ2 = (ba) 2/12です。この場合、(6-2) 2/12 = 1.33となります。

一様分布から 2 のランダムなサンプルを取得する

ここで、この母集団から 2 匹のカメのランダムなサンプルを採取し、各カメの甲羅の幅を測定すると想像してください。最初のカメの甲羅の幅が 3 インチ、2 番目のカメの甲羅の幅が 6 インチであると仮定します。この 2 頭のカメのサンプルの平均幅は 4.5 インチです。

次に、この母集団から 2 匹のカメの別のランダムなサンプルを採取し、各カメの甲羅の幅を再度測定すると想像してください。最初のカメの甲羅の幅が 2.5 インチで、2 番目のカメの甲羅の幅も 2.5 インチであると仮定します。この 2 匹のカメのサンプルの平均幅は 2.5 インチです。

2 匹のカメからランダムなサンプルを何度も繰り返し採取し、毎回平均的な甲羅の幅を見つけ続けると想像してください。

2 匹のカメから採取したサンプルすべての平均甲羅幅を表すヒストグラムを作成すると、次のようになります。

一様分布のサンプルサイズ 2 の中心極限定理
これは標本平均値の分布を示すため、標本平均値の標本分布と呼ばれます。

この標本分布の平均はx = μ = 4です。

この標本分布の分散は、 s2 = σ2 / n = 1.33 / 2 = 0.665です。

一様分布から 5 つのランダムなサンプルを取得する

同じ実験を繰り返すと想像してください。ただし、今回は 5 匹のカメからランダムにサンプルを何度も採取し、そのたびに平均甲羅幅を求めます。

5 匹のカメのこれらすべてのサンプルの平均甲羅幅を表すヒストグラムを作成すると、次のようになります。

均一なサンプルサイズ分布に対する中心極限定理 5
この分布は、正規分布に似た「鐘」型になっていることに注目してください。これは、5 個のサンプルを取得すると、サンプル平均間の分散がはるかに小さくなるため、平均が 2 インチまたは 6 インチに近いサンプルを取得する可能性が低くなり、平均が 2 インチまたは 6 インチに近いサンプルを取得する可能性が高くなるためです。 6インチ。平均は実際の母集団の平均に 4 インチ近くなります。

この標本分布の平均はx = μ = 4です。

この標本分布の分散は、 s2 = σ2 / n = 1.33 / 5 = 0.266です。

一様分布から 30 個のランダムなサンプルを取得する

同じ実験を繰り返すと想像してください。ただし、今回は 30 匹のカメからランダムにサンプルを繰り返し採取し、毎回平均甲羅幅を求めます。

30 匹のカメのサンプルすべての平均甲羅幅を表すヒストグラムを作成すると、次のようになります。

サンプルサイズ 30 の中心極限定理
この標本分布は前の 2 つの分布よりもさらに釣鐘型で、さらに狭いことに注目してください。

この標本分布の平均はx = μ = 4です。

この標本分布の分散s2 = σ2 / n = 1.33 / 30 = 0.044

カイ二乗分布

特定の都市の家族あたりのペットの数が、自由度 3 のカイ二乗分布に従うと仮定します。家族ごとの動物の分布を表すヒストグラムを作成すると、次のようになります。

カイ二乗分布の中心極限定理

カイ二乗分布の平均は、単に自由度 (df) の数です。この場合、 μ = 3です。

カイ二乗分布の分散は 2 * df です。この場合、 σ2 = 2 * 3 = 6 となります。

2 つのランダムなサンプルを取得する

この母集団から 2 つの家族のランダムなサンプルを抽出し、各家族のペットの数を数えると想像してください。最初の家族には 4 匹のペットがいて、2 番目の家族には 1 匹のペットがいるとします。このサンプルの 2 家族のペットの平均数は 2.5 匹です。

次に、この母集団から 2 家族の別のランダム サンプルを取得し、各家族のペットの数を再度数えると想像してください。最初の家族が 6 匹のペットを飼っており、2 番目の家族が 4 匹のペットを飼っているとします。この 2 家族のサンプルのペットの平均数は 5 です。

2 つの家族からランダムなサンプルを何度も繰り返し採取し、毎回ペットの平均数を見つけ続けると想像してください。

2 つの家族のこれらすべてのサンプルのペットの平均数を表すヒストグラムを作成すると、次のようになります。

カイ二乗分布のサンプルサイズが 2 の中心極限定理

この標本分布の平均はx = μ = 3です。

この標本分布の分散は s 2 = σ 2 / n = 6 / 2 = 3です。

10 個のランダムなサンプルを取得する

同じ実験を繰り返すと想像してください。ただし、今回は 10 家族から無作為にサンプルを何度も採取し、毎回、家族あたりの動物の平均数を求めます。

10 家族のサンプルすべてにおける家族あたりの動物の平均数を表すヒストグラムを作成すると、次のようになります。

カイ二乗分布による中心極限定理

この標本分布の平均はx = μ = 3です。

この標本分布の分散はs2 = σ2 / n = 6/10 = 0.6です。

30 個のランダムなサンプルを取得する

同じ実験を繰り返すと想像してください。ただし、今回は 30 家族から無作為にサンプルを何度も採取し、毎回、家族あたりの動物の平均数を求めます。

30 家族のサンプルすべてにわたる家族あたりの動物の平均数を表すヒストグラムを作成すると、次のようになります。

カイ二乗分布を使用した中心極限定理のヒストグラム

この標本分布の平均はx = μ = 3です。

この標本分布の分散はs2 = σ2 / n = 6/30 = 0.2です。

まとめ

これら 2 つの例から得られる主なポイントは次のとおりです。

  • たとえ母集団の分布が正規でなくても、サンプルサイズが十分に大きければ、標本平均の標本分布はほぼ正規になります。上の 2 つの例では、一様分布もカイ二乗分布も正規分布ではありませんでした (まったく「釣鐘」型ではありませんでした)。しかし、十分な大きさのサンプルを採取すると、サンプル平均の分布は次のように変化しました。普通であってください。
  • サンプルサイズが大きいほど、サンプル平均の分散は小さくなります。

「十分な大きさ」を定義する

中心極限定理では、たとえ母集団の分布が正規でなくても、サンプルサイズが「十分に大きい」場合にはサンプル平均のサンプル分布はほぼ正規になると述べていることを思い出してください。

中心極限定理が適用されるサンプルの大きさについて正確な定義はありませんが、一般に、サンプルの由来となる母集団分布の歪度によって決まります。

  • 母集団の分布が対称的である場合、サンプル サイズが 15 程度で十分な場合があります。
  • 母集団の分布が偏っている場合、通常は少なくとも 30 人のサンプルが必要です。
  • 人口分布が極端に偏っている場合は、40 人以上のサンプルが必要になる場合があります。

このトピックの詳細については、大規模なサンプルのコンディショニングに関するこのチュートリアルを参照してください。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です