Когда использовать s/sqrt(n) в статистике
В статистике вы встретите формулу s/√ n в разных сценариях.
Эта формула используется для расчета стандартной ошибки выборочного среднего.
В формуле s представляет собой стандартное отклонение выборки, а n представляет размер выборки.
Эта формула появляется при расчете двух статистических тестов:
1. Выборочный t-критерий
2. Доверительный интервал для генерального среднего значения
Следующие примеры показывают, как использовать s/√ n в этих двух сценариях.
Пример 1. Использование s/sqrt(n) в одновыборочном t-тесте
Одновыборочный t-критерий используется для проверки того, соответствует ли среднее значение совокупности определенному значению.
Мы используем следующую формулу для расчета статистики t-критерия:
т = ( X – µ) / (s/ √n )
Золото:
- x : выборочное среднее
- μ 0 : гипотетическое среднее значение по численности населения
- s: выборочное стандартное отклонение
- n: размер выборки
Например, предположим, что мы хотим проверить, равен ли средний вес черепах в данной популяции 300 фунтам.
Мы собираем простую случайную выборку черепах со следующей информацией:
- Размер выборки n = 40
- Средний вес выборки x = 300
- Выборочное стандартное отклонение s = 18,5
Мы проведем одновыборочный t-тест со следующими гипотезами:
- H 0 : μ = 310 (в среднем по популяции равно 310 книгам)
- H A : μ ≠ 310 (средняя численность населения не равна 310 фунтам)
Сначала посчитаем статистику теста:
t = ( x – µ) / (s/ √n ) = (300-310) / (18,5/ √40 ) = -3,4187
Согласно калькулятору T-оценки для P-значения , значение p, связанное с t = -3,4817 и степенями свободы = n-1 = 40-1 = 39, составляет 0,00149.
Поскольку это значение p меньше 0,05, мы отвергаем нулевую гипотезу. У нас есть достаточно доказательств, чтобы сказать, что средний вес черепах этого вида не равен 310 фунтам.
Пример 2. Использование s/sqrt(n) в доверительном интервале для среднего генерального значения
Доверительный интервал для среднего значения генеральной совокупности — это диапазон значений, который может содержать среднее значение генеральной совокупности с определенным уровнем достоверности.
Мы используем следующую формулу для расчета доверительного интервала для среднего значения:
Доверительный интервал = x +/- t n-1, 1-α/2 *(s/√ n )
Золото:
- x : выборочное среднее
- t: t-критическое значение
- s: выборочное стандартное отклонение
- n: размер выборки
Например, предположим, что мы хотим рассчитать доверительный интервал для истинного среднего веса черепах в определенной популяции.
Мы собираем простую случайную выборку черепах со следующей информацией:
- Размер выборки n = 40
- Средний вес выборки x = 300
- Выборочное стандартное отклонение s = 18,5
Мы можем использовать следующую формулу для расчета 95% доверительного интервала для истинного среднего веса популяции черепах:
- 95% ДИ = x +/- t n-1, 1-α/2 *(s/√ n )
- 95% ДИ = 300 +/- (2,022691) * (18,5/√ 40 )
- 95% ДИ = [294,083, 305,917]
95% доверительный интервал для истинного среднего веса популяции черепах составляет от 294 083 до 305 917 фунтов.
Дополнительные ресурсы
В следующих руководствах объясняется, как рассчитать стандартную ошибку среднего значения в различных программах:
Как рассчитать стандартную ошибку среднего значения в Excel
Как рассчитать стандартную ошибку среднего значения в R
Как рассчитать стандартную ошибку среднего значения в Python