R でクラスター化標準偏差を計算する方法


プールされた標準偏差は、 2 つ以上の独立したグループの標準偏差の加重平均です。

統計では、 2 つの母集団の平均が等しいかどうかを検定するために使用される 2 標本 t 検定で最も一般的に現れます。

2 つのグループのクラスター化標準偏差を計算する式は次のとおりです。

プールされた標準偏差 = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

金:

  • n1n2 :それぞれグループ 1 とグループ 2 のサンプル サイズ。
  • s 1 、s 2 :それぞれグループ 1 とグループ 2 の標準偏差。

次の例は、R の 2 つのグループ間のクラスター化標準偏差を計算する 2 つの方法を示しています。

方法 1: クラスター化された標準偏差を手動で計算する

2 つのサンプルに対して次のデータ値があるとします。

  • サンプル1 :6、6、7、8、8、10、11、13、15、15、16、17、19、19、21
  • サンプル2 :10、11、13、13、15、17、17、19、20、22、24、25、27、29、29

次のコードは、これら 2 つのサンプル間のプールされた標準偏差を計算する方法を示しています。

 #define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#find sample standard deviation of each sample
s1 <- sd (data1)
s2 < -sd (data2)

#find sample size of each sample
n1 <- length (data1)
n2 <- length (data2)

#calculate pooled standard deviation
pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2))

#view pooled standard deviation
pooled

[1] 5.789564

プールされた標準偏差は5.789564であることがわかります。

方法 2: パッケージを使用してクラスター化標準偏差を計算する

R の 2 つのサンプル間のプールされた標準偏差を計算する別の方法は、 effectizeパッケージのsd_pooled()関数を使用することです。

次のコードは、この関数を実際に使用する方法を示しています。

 library (effectsize)

#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#calculate pooled standard deviation between two samples
sd_pooled(data1, data2)

[1] 5.789564

プールされた標準偏差は5.789564であることがわかります。

これは、前の例で手動で計算した値と一致することに注意してください。

追加リソース

次のチュートリアルでは、クラスター化標準偏差の計算について詳しく説明します。

クラスター化標準偏差の概要
クラスター化標準偏差計算機

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です