Python で平均の標準誤差を計算する方法


平均の標準誤差は、データセット内の値の分布を測定する方法です。次のように計算されます。

平均の標準誤差 = s / √n

金:

  • s : サンプル標準偏差
  • n : サンプルサイズ

このチュートリアルでは、Python でデータセットの平均の標準誤差を計算するために使用できる 2 つの方法について説明します。どちらの方法でもまったく同じ結果が得られることに注意してください。

方法 1: SciPy を使用する

平均の標準誤差を計算する最初の方法は、SciPy Stats ライブラリのsem()関数を使用することです。

次のコードは、この関数の使用方法を示しています。

 from scipy. stats import week

#define dataset 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]

#calculate standard error of the mean 
sem(data)

2.001447

平均の標準誤差は2.001447であることがわかります。

方法 2: NumPy を使用する

データセットの平均の標準誤差を計算する別の方法は、NumPy のstd()関数を使用することです。

母集団標準偏差ではなく標本標準偏差を計算するには、この関数の引数にddof=1を指定する必要があることに注意してください。

次のコードは、これを行う方法を示しています。

 import numpy as np

#define dataset
data = np.array([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29])

#calculate standard error of the mean 
n.p. std (data, ddof= 1 ) / np. sqrt ( np.size (data))

2.001447

ここでも、平均の標準誤差は2.001447であることがわかります。

平均値の標準誤差を解釈する方法

平均値の標準誤差は、単に平均値の周囲の値の広がりの尺度です。平均値の標準誤差を解釈する際には、次の 2 つの点に留意する必要があります。

1. 平均値の標準誤差が大きいほど、データセット内の値は平均値の周囲にばらつきます。

これを説明するために、前のデータセットの最後の値をさらに大きな数値で変更する場合を考えてみましょう。

 from scipy. stats import week

#define dataset 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ]

#calculate standard error of the mean 
sem(data)

6.978265

標準誤差が2.001447から6.978265に増加することに注目してください。これは、このデータセットの値が前のデータセットと比較して平均値付近に分散していることを示しています。

2. サンプルサイズが増加するにつれて、平均値の標準誤差は減少する傾向があります。

これを説明するために、次の 2 つのデータセットの平均の標準誤差を考えてみましょう。

 from scipy . stats import week 

#define first dataset and find SEM
data1 = [1, 2, 3, 4, 5]
sem(data1)

0.7071068

#define second dataset and find SEM
data2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5]
sem(data2)

0.4714045

2 番目のデータ セットは、単純に 2 回繰り返された最初のデータ セットです。したがって、両方のデータ セットの平均値は同じですが、2 番目のデータ セットのサンプル サイズが大きいため、標準誤差が小さくなります。

追加リソース

R の平均の標準誤差を計算する方法
Excel で平均の標準誤差を計算する方法
Googleスプレッドシートで平均値の標準誤差を計算する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です