R の平均の標準誤差を計算する方法


平均の標準誤差は、データセット内の値の分布を測定する方法です。次のように計算されます。

標準誤差 = s / √n

金:

  • s : サンプル標準偏差
  • n : サンプルサイズ

このチュートリアルでは、R でデータセットの標準誤差を計算するために使用できる 2 つの方法について説明します。

方法 1: Plotrix ライブラリを使用する

平均の標準誤差を計算する最初の方法は、Plotrix ライブラリの組み込みstd.error()関数を使用することです。

次のコードは、この関数の使用方法を示しています。

 library (plotrix)

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

平均の標準誤差は2.001447であることがわかります。

方法 2: 独自の関数を定義する

データセットの平均の標準誤差を計算するもう 1 つの方法は、独自の関数を単純に定義することです。

次のコードは、これを行う方法を示しています。

 #define standard error of mean function
std.error <- function (x) sd(x)/sqrt( length (x))

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

ここでも、平均の標準誤差は2.0014であることがわかります。

平均値の標準誤差を解釈する方法

平均値の標準誤差は、単に平均値の周囲の値の広がりの尺度です。

平均値の標準誤差を解釈する際には、次の 2 つの点に留意する必要があります。

1. 平均値の標準誤差が大きいほど、データセット内の値は平均値の周囲にばらつきます。

これを説明するために、前のデータセットの最後の値をさらに大きな数値で変更する場合を考えてみましょう。

 #define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150)

#calculate standard error of the mean 
std.error(data)

6.978265

標準誤差が2.001447から6.978265に増加することに注目してください。

これは、このデータセットの値が前のデータセットと比較して平均値付近に分散していることを示しています。

2. サンプルサイズが増加するにつれて、平均値の標準誤差は減少する傾向があります。

これを説明するために、次の 2 つのデータセットの平均の標準誤差を考えてみましょう。

 #define first dataset and find SEM
data1 <- c(1, 2, 3, 4, 5)
std.error(data1)

0.7071068

#define second dataset and find SEM
data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5)
std.error(data2)

0.4714045

2 番目のデータ セットは、単純に 2 回繰り返された最初のデータ セットです。

したがって、両方のデータ セットの平均値は同じですが、2 番目のデータ セットのサンプル サイズが大きいため、標準誤差が小さくなります。

追加リソース

次のチュートリアルでは、R で他の一般的なタスクを実行する方法について説明します。

R で標本と母集団の分散を計算する方法
R でプールされた分散を計算する方法
Rの変動係数の計算方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です