Python で平均の標準誤差を計算する方法
平均の標準誤差は、データセット内の値の分布を測定する方法です。次のように計算されます。
平均の標準誤差 = s / √n
金:
- s : サンプル標準偏差
- n : サンプルサイズ
このチュートリアルでは、Python でデータセットの平均の標準誤差を計算するために使用できる 2 つの方法について説明します。どちらの方法でもまったく同じ結果が得られることに注意してください。
方法 1: SciPy を使用する
平均の標準誤差を計算する最初の方法は、SciPy Stats ライブラリのsem()関数を使用することです。
次のコードは、この関数の使用方法を示しています。
from scipy. stats import week #define dataset data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29] #calculate standard error of the mean sem(data) 2.001447
平均の標準誤差は2.001447であることがわかります。
方法 2: NumPy を使用する
データセットの平均の標準誤差を計算する別の方法は、NumPy のstd()関数を使用することです。
母集団標準偏差ではなく標本標準偏差を計算するには、この関数の引数にddof=1を指定する必要があることに注意してください。
次のコードは、これを行う方法を示しています。
import numpy as np #define dataset data = np.array([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]) #calculate standard error of the mean n.p. std (data, ddof= 1 ) / np. sqrt ( np.size (data)) 2.001447
ここでも、平均の標準誤差は2.001447であることがわかります。
平均値の標準誤差を解釈する方法
平均値の標準誤差は、単に平均値の周囲の値の広がりの尺度です。平均値の標準誤差を解釈する際には、次の 2 つの点に留意する必要があります。
1. 平均値の標準誤差が大きいほど、データセット内の値は平均値の周囲にばらつきます。
これを説明するために、前のデータセットの最後の値をさらに大きな数値で変更する場合を考えてみましょう。
from scipy. stats import week #define dataset data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ] #calculate standard error of the mean sem(data) 6.978265
標準誤差が2.001447から6.978265に増加することに注目してください。これは、このデータセットの値が前のデータセットと比較して平均値付近に分散していることを示しています。
2. サンプルサイズが増加するにつれて、平均値の標準誤差は減少する傾向があります。
これを説明するために、次の 2 つのデータセットの平均の標準誤差を考えてみましょう。
from scipy . stats import week #define first dataset and find SEM data1 = [1, 2, 3, 4, 5] sem(data1) 0.7071068 #define second dataset and find SEM data2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5] sem(data2) 0.4714045
2 番目のデータ セットは、単純に 2 回繰り返された最初のデータ セットです。したがって、両方のデータ セットの平均値は同じですが、2 番目のデータ セットのサンプル サイズが大きいため、標準誤差が小さくなります。
追加リソース
R の平均の標準誤差を計算する方法
Excel で平均の標準誤差を計算する方法
Googleスプレッドシートで平均値の標準誤差を計算する方法