R でクラスター化標準偏差を計算する方法
プールされた標準偏差は、 2 つ以上の独立したグループの標準偏差の加重平均です。
統計では、 2 つの母集団の平均が等しいかどうかを検定するために使用される 2 標本 t 検定で最も一般的に現れます。
2 つのグループのクラスター化標準偏差を計算する式は次のとおりです。
プールされた標準偏差 = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
金:
- n1 、 n2 :それぞれグループ 1 とグループ 2 のサンプル サイズ。
- s 1 、s 2 :それぞれグループ 1 とグループ 2 の標準偏差。
次の例は、R の 2 つのグループ間のクラスター化標準偏差を計算する 2 つの方法を示しています。
方法 1: クラスター化された標準偏差を手動で計算する
2 つのサンプルに対して次のデータ値があるとします。
- サンプル1 :6、6、7、8、8、10、11、13、15、15、16、17、19、19、21
- サンプル2 :10、11、13、13、15、17、17、19、20、22、24、25、27、29、29
次のコードは、これら 2 つのサンプル間のプールされた標準偏差を計算する方法を示しています。
#define two samples data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21) data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29) #find sample standard deviation of each sample s1 <- sd (data1) s2 < -sd (data2) #find sample size of each sample n1 <- length (data1) n2 <- length (data2) #calculate pooled standard deviation pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2)) #view pooled standard deviation pooled [1] 5.789564
プールされた標準偏差は5.789564であることがわかります。
方法 2: パッケージを使用してクラスター化標準偏差を計算する
R の 2 つのサンプル間のプールされた標準偏差を計算する別の方法は、 effectizeパッケージのsd_pooled()関数を使用することです。
次のコードは、この関数を実際に使用する方法を示しています。
library (effectsize) #define two samples data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21) data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29) #calculate pooled standard deviation between two samples sd_pooled(data1, data2) [1] 5.789564
プールされた標準偏差は5.789564であることがわかります。
これは、前の例で手動で計算した値と一致することに注意してください。
追加リソース
次のチュートリアルでは、クラスター化標準偏差の計算について詳しく説明します。
クラスター化標準偏差の概要
クラスター化標準偏差計算機