R の平均の標準誤差を計算する方法
平均の標準誤差は、データセット内の値の分布を測定する方法です。次のように計算されます。
標準誤差 = s / √n
金:
- s : サンプル標準偏差
- n : サンプルサイズ
このチュートリアルでは、R でデータセットの標準誤差を計算するために使用できる 2 つの方法について説明します。
方法 1: Plotrix ライブラリを使用する
平均の標準誤差を計算する最初の方法は、Plotrix ライブラリの組み込みstd.error()関数を使用することです。
次のコードは、この関数の使用方法を示しています。
library (plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
平均の標準誤差は2.001447であることがわかります。
方法 2: 独自の関数を定義する
データセットの平均の標準誤差を計算するもう 1 つの方法は、独自の関数を単純に定義することです。
次のコードは、これを行う方法を示しています。
#define standard error of mean function std.error <- function (x) sd(x)/sqrt( length (x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
ここでも、平均の標準誤差は2.0014であることがわかります。
平均値の標準誤差を解釈する方法
平均値の標準誤差は、単に平均値の周囲の値の広がりの尺度です。
平均値の標準誤差を解釈する際には、次の 2 つの点に留意する必要があります。
1. 平均値の標準誤差が大きいほど、データセット内の値は平均値の周囲にばらつきます。
これを説明するために、前のデータセットの最後の値をさらに大きな数値で変更する場合を考えてみましょう。
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
標準誤差が2.001447から6.978265に増加することに注目してください。
これは、このデータセットの値が前のデータセットと比較して平均値付近に分散していることを示しています。
2. サンプルサイズが増加するにつれて、平均値の標準誤差は減少する傾向があります。
これを説明するために、次の 2 つのデータセットの平均の標準誤差を考えてみましょう。
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
2 番目のデータ セットは、単純に 2 回繰り返された最初のデータ セットです。
したがって、両方のデータ セットの平均値は同じですが、2 番目のデータ セットのサンプル サイズが大きいため、標準誤差が小さくなります。
追加リソース
次のチュートリアルでは、R で他の一般的なタスクを実行する方法について説明します。