Как вычислить стандартную ошибку среднего значения в python


Стандартная ошибка среднего — это способ измерения распределения значений в наборе данных. Он рассчитывается следующим образом:

Стандартная ошибка среднего = s / √n

Золото:

  • s : выборочное стандартное отклонение
  • n : размер выборки

В этом руководстве объясняются два метода, которые можно использовать для расчета стандартной ошибки среднего значения набора данных в Python. Обратите внимание, что оба метода дают одинаковые результаты.

Способ 1: используйте SciPy

Первый способ вычислить стандартную ошибку среднего значения — использовать функцию sem() из библиотеки SciPy Stats.

Следующий код показывает, как использовать эту функцию:

 from scipy. stats import week

#define dataset 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]

#calculate standard error of the mean 
sem(data)

2.001447

Стандартная ошибка среднего значения равна 2,001447 .

Способ 2: используйте NumPy

Другой способ вычислить стандартную ошибку среднего значения набора данных — использовать функцию std() NumPy.

Обратите внимание, что нам нужно указать ddof=1 в аргументе этой функции, чтобы вычислить стандартное отклонение выборки, а не стандартное отклонение генеральной совокупности.

Следующий код показывает, как это сделать:

 import numpy as np

#define dataset
data = np.array([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29])

#calculate standard error of the mean 
n.p. std (data, ddof= 1 ) / np. sqrt ( np.size (data))

2.001447

Опять же, стандартная ошибка среднего значения равна 2,001447 .

Как интерпретировать стандартную ошибку среднего значения

Стандартная ошибка среднего — это просто мера разброса значений вокруг среднего. При интерпретации стандартной ошибки среднего значения следует иметь в виду две вещи:

1. Чем больше стандартная ошибка среднего, тем более разбросаны значения вокруг среднего в наборе данных.

Чтобы проиллюстрировать это, рассмотрим, изменим ли мы последнее значение предыдущего набора данных на гораздо большее число:

 from scipy. stats import week

#define dataset 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ]

#calculate standard error of the mean 
sem(data)

6.978265

Обратите внимание, как стандартная ошибка увеличивается с 2,001447 до 6,978265 . Это указывает на то, что значения в этом наборе данных больше распределены вокруг среднего значения по сравнению с предыдущим набором данных.

2. По мере увеличения размера выборки стандартная ошибка среднего имеет тенденцию к уменьшению.

Чтобы проиллюстрировать это, рассмотрим стандартную ошибку среднего значения для следующих двух наборов данных:

 from scipy . stats import week 

#define first dataset and find SEM
data1 = [1, 2, 3, 4, 5]
sem(data1)

0.7071068

#define second dataset and find SEM
data2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5]
sem(data2)

0.4714045

Второй набор данных — это просто первый набор данных, повторенный дважды. Таким образом, оба набора данных имеют одинаковое среднее значение, но второй набор данных имеет больший размер выборки и, следовательно, имеет меньшую стандартную ошибку.

Дополнительные ресурсы

Как рассчитать стандартную ошибку среднего значения в R
Как рассчитать стандартную ошибку среднего значения в Excel
Как рассчитать стандартную ошибку среднего в Google Таблицах

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *