R でプールされた分散を計算する方法
統計学では、クラスター分散は2 つ以上のクラスター分散の平均を指します。
「プールされた」という言葉は、グループ間の共通分散の 1 つの数値を取得するために 2 つ以上のグループ分散を「プール」していることを示します。
実際には、プールされた分散は、2 つの母集団の平均が等しいかどうかを判断するために使用される2 サンプル t 検定で最もよく使用されます。
2 つのサンプル間のプールされた分散は一般にsp 2で示され、次のように計算されます。
s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
残念ながら、R には 2 つのグループ間のプールされた分散を計算する組み込み関数はありませんが、非常に簡単に計算できます。
たとえば、次の 2 つのグループ間のプールされた分散を計算するとします。
次のコードは、R 内のこれらのグループ間のプールされた分散を計算する方法を示しています。
#define groups of data x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20) x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32) #calculate sample size of each group n1 <- length(x1) n2 <- length(x2) #calculate sample variance of each group var1 <- var(x1) var2 <- var(x2) #calculate pooled variance between the two groups pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2) #display pooled variance pooled [1] 46.97143
これら 2 つのグループ間のプールされた分散は46.97143であることがわかります。
追加リソース
クラスター分散とは何ですか? (定義と例)
バンドルされたギャップ計算ツール
Excel でプールされた分散を計算する方法