クラスター分散とは何ですか? (定義&例)

によるベンジャミン・アンダーソン博士 7月 26, 2023 ガイド 0コメント

統計学では、クラスター分散は単に 2 つ以上のクラスター分散の平均を指します。

「プールされた」という言葉は、グループ間の共通分散の 1 つの数値を取得するために 2 つ以上のグループ分散を「プール」していることを示します。

実際には、プールされた分散は、2 つの母集団の平均が等しいかどうかを判断するために使用される2 サンプル t 検定で最もよく使用されます。

2 つのサンプル間のプールされた分散は一般に_sp ²で示され、次のように計算されます。

s _p ² = ( (n ₁ -1)s ₁ ² + (n ₂ -1)s ₂ ² ) / (n ₁ +n ₂ -2)

2 つのサンプルサイズ (n ₁と n ₂ ) が等しい場合、式は次のように単純化されます。

s _p ² = (s ₁ ² + s ₂ ² ) / 2

2 つの母集団の平均を比較したい場合、次の 2 つの統計検定を使用できる可能性があります。

1. 2 サンプル t 検定: この検定は、2 つのサンプル間の分散がほぼ等しいと仮定します。この検定を使用する場合、プールされた分散が計算されます。

2.ウェルチの t 検定: この検定では、2 つのサンプル間の分散がほぼ等しいとは想定されていません。この検定を使用する場合、プールされた分散は計算されません。代わりに、別の式を使用します。

どのテストを使用するかを決定するには、次の経験則を使用します。

一般規則:最大分散と最小分散の比が 4 未満の場合、分散はほぼ等しいと仮定して、2 標本 t 検定を使用できます。

たとえば、サンプル 1 の分散が 24.5、サンプル 2 の分散が 15.2 であるとします。最大サンプル分散と最小サンプル分散の比率は次のように計算されます。

比率: 24.5 / 15.2 = 1.61

この比率が 4 未満であるため、2 つのグループ間の差異はほぼ等しいと想定できます。したがって、2 サンプルの t 検定を使用します。これは、プールされた分散を計算することを意味します。

2 つの異なる種のカメの平均体重が等しいかどうかを知りたいとします。これをテストするために、次の情報を使用して各集団からランダムにカメのサンプルを収集します。

サンプル 1:

サンプル 2:

2 つのサンプル間のプールされた分散を計算する方法は次のとおりです。

プールされた分散は12,755です。

プールされた分散値は、2 つの元の分散 18.5 と 6.7 の間にあることに注意してください。プールされた分散が 2 つのサンプル分散の加重平均にすぎないことを考えると、これは理にかなっています。

ボーナスリソース:このプール分散計算ツールを使用して、2 つのサンプル間のプール分散を自動的に計算します。

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る