Взаимосвязь между размером выборки и погрешностью
Часто в статистике мы хотим оценить значение какого-либо параметра населения , такого как доля населения или среднее значение численности населения .
Чтобы оценить эти значения, мы обычно собираем простую случайную выборку и рассчитываем долю выборки или среднее значение выборки.
Затем мы строим доверительный интервал , чтобы отразить нашу неопределенность в отношении этих оценок.
Мы используем следующую формулу для расчета доверительного интервала для доли населения:
Доверительный интервал = p ± z*√ p(1-p)/n
Золото:
- p: доля выборки
- z: выбранное значение z
- n: размер выборки
И мы используем следующую формулу для расчета доверительного интервала для среднего значения совокупности:
Доверительный интервал = x̄ ± z*(s/√ n )
Золото:
- x̄: выборочное среднее
- z: выбранное значение z
- s : выборочное стандартное отклонение
- n: размер выборки
В обеих формулах существует обратная зависимость между размером выборки и погрешностью.
Чем больше размер выборки, тем ниже предел погрешности. И наоборот, чем меньше размер выборки, тем больше погрешность.
Посмотрите следующие два примера, чтобы лучше понять это.
Пример 1: Размер выборки и погрешность для доли населения
Мы используем следующую формулу для расчета доверительного интервала для доли населения:
Доверительный интервал = p ± z*√ p(1-p)/n
Часть, выделенная красным, называется пределом погрешности :
Доверительный интервал = p ± z*√ p(1-p)/n
Обратите внимание, что в пределах погрешности мы делим на n (размер выборки).
Поэтому, когда размер выборки велик, мы делим его на большое число, что снижает общую погрешность. Это приводит к сужению доверительного интервала.
Например, предположим, что мы собираем простую случайную выборку данных со следующей информацией:
- р: 0,6
- н: 25
Вот как рассчитать 95% доверительный интервал для доли населения:
- Доверительный интервал = p ± z*√ p(1-p) / n
- Доверительный интервал = 0,6 ± 1,96*√ 0,6(1-0,6)/25
- Доверительный интервал = 0,6 ± 0,192.
- Доверительный интервал = [0,408, 0,792]
Теперь представьте, если бы вместо этого мы использовали размер выборки в 200 человек. Вот как мы могли бы рассчитать 95% доверительный интервал для доли населения:
- Доверительный интервал = p ± z*√ p(1-p)/n
- Доверительный интервал = 0,6 ± 1,96*√ 0,6(1-0,6)/200
- Доверительный интервал = 0,6 ± 0,068.
- Доверительный интервал = [0,532, 0,668]
Обратите внимание: просто увеличив размер выборки, мы смогли уменьшить погрешность и получить гораздо более узкий доверительный интервал.
Пример 2: Размер выборки и погрешность для среднего показателя по генеральной совокупности
Мы используем следующую формулу для расчета доверительного интервала для среднего значения совокупности:
Доверительный интервал = x̄ ± z*(s/√ n )
Часть, выделенная красным, называется пределом погрешности :
Доверительный интервал = x̄ ± z*(s/√ n )
Обратите внимание, что в пределах погрешности мы делим на n (размер выборки).
Поэтому, когда размер выборки велик, мы делим его на большое число, что снижает общую погрешность. Это приводит к сужению доверительного интервала.
Например, предположим, что мы собираем простую случайную выборку данных со следующей информацией:
- х̄: 15
- с : 4
- н: 25
Вот как рассчитать 95% доверительный интервал для генеральной совокупности:
- Доверительный интервал = x̄ ± z*(s/√ n )
- Доверительный интервал = 15 ± 1,96*(4/√ 25 )
- Доверительный интервал = 15 ± 1,568.
- Доверительный интервал = [13,432, 16,568]
Теперь представьте, если бы вместо этого мы использовали размер выборки в 200 человек. Вот как мы могли бы рассчитать 95% доверительный интервал для среднего значения генеральной совокупности:
- Доверительный интервал = x̄ ± z*(s/√ n )
- Доверительный интервал = 15 ± 1,96*(4/√ 200 )
- Доверительный интервал = 15 ± 0,554.
- Доверительный интервал = [14,446, 15,554]
Обратите внимание: просто увеличив размер выборки, мы смогли уменьшить погрешность и получить более узкий доверительный интервал.
Дополнительные ресурсы
В следующих руководствах представлена дополнительная информация о доверительных интервалах для пропорции:
Следующие учебные пособия предоставляют дополнительную информацию о доверительных интервалах для среднего значения: