R でプールされた分散を計算する方法


統計学では、クラスター分散は2 つ以上のクラスター分散の平均を指します。

「プールされた」という言葉は、グループ間の共通分散の 1 つの数値を取得するために 2 つ以上のグループ分散を「プール」していることを示します。

実際には、プールされた分散は、2 つの母集団の平均が等しいかどうかを判断するために使用される2 サンプル t 検定で最もよく使用されます。

2 つのサンプル間のプールされた分散は一般にsp 2で示され、次のように計算されます。

s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)

残念ながら、R には 2 つのグループ間のプールされた分散を計算する組み込み関数はありませんが、非常に簡単に計算できます。

たとえば、次の 2 つのグループ間のプールされた分散を計算するとします。

次のコードは、R 内のこれらのグループ間のプールされた分散を計算する方法を示しています。

 #define groups of data
x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20)
x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32)

#calculate sample size of each group
n1 <- length(x1)
n2 <- length(x2)

#calculate sample variance of each group
var1 <- var(x1)
var2 <- var(x2)

#calculate pooled variance between the two groups
pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2)

#display pooled variance
pooled

[1] 46.97143

これら 2 つのグループ間のプールされた分散は46.97143であることがわかります。

追加リソース

クラスター分散とは何ですか? (定義と例)
バンドルされたギャップ計算ツール
Excel でプールされた分散を計算する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です