サンプル分散と母集団の分散: 違いは何ですか?
分散は、データセット内の値の分布を測定する方法です。
母集団の分散を計算する式は次のとおりです。
σ 2 = Σ (x i – μ) 2 / N
金:
- Σ :「和」を意味する記号
- μ : 母集団平均
- x i : 母集団の i番目の要素
- N : 人口規模
標本分散を計算する式は次のとおりです。
s 2 = Σ (x i – x ) 2 / (n-1)
金:
- x : サンプル平均
- x i : サンプルの i番目の要素
- n : サンプルサイズ
2 つの式の間にはほんのわずかな違いがあることに注意してください。
母集団の分散を計算するときは、 N (母集団のサイズ) で割ります。
標本分散を計算するときは、 n-1 (標本サイズ – 1) で割ります。
標本分散を計算するときは、n-1 で割るいわゆるベッセル補正を適用します。
数学的な詳細にとらわれずに、n-1 で除算すると、母集団の分散の不偏推定値が得られることが証明される可能性があります。いずれにせよ、通常はこの値が関心のある値です。
標本分散と母集団分散をいつ計算するか
標本の分散を計算するか母集団の分散を計算するかわからない場合は、次の一般規則に留意してください。
扱っているデータセットが、より大きな対象母集団から採取されたサンプルを表す場合、サンプル分散を計算する必要があります。
操作しているデータセットが母集団全体、つまり関心のあるすべての値を表す場合、母集団の分散を計算する必要があります。
次の例は、標本分散と母集団分散を計算するためのさまざまなシナリオを示しています。
例: サンプル分散の計算
植物学者が特定の植物種の高さの変化を計算したいとします。 1 つのエリアには何千もの個別の植物があるため、彼女は 20 個の植物から単純に無作為にサンプルを採取し、それぞれの高さを測定することにしました。
このシナリオでは、植物学者は植物個体群全体の分散に関心があるものの、単にこのサンプルを使用して真の個体群分散を推定しているだけであるため、サンプル分散を計算する必要があります。
例: 母集団分散の計算
教師がクラスの 20 人の生徒の試験の得点の分散を計算したいとします。
このシナリオでは、教師が使用しているデータ セット (20 件の試験結果) が関心のある母集団全体を表すため、教師は母集団の分散を計算する必要があります。
追加リソース
次のチュートリアルでは、さまざまな統計ソフトウェアで標本分散と母集団分散を計算する方法を説明します。
Excel でサンプルと母集団の分散を計算する方法
R で標本と母集団の分散を計算する方法
Python で標本と母集団の分散を計算する方法