Что такое хороший доверительный интервал?
Доверительный интервал — это диапазон значений, который может содержать параметр совокупности с определенным уровнем достоверности.
Студенты часто задают вопрос:
Что считается хорошим доверительным интервалом?
Ответ: В целом узкие доверительные интервалы более желательны, поскольку они предоставляют нам узкий диапазон значений, которые, как мы уверены, содержат определенные параметры совокупности.
Например, предположим, что мы хотим оценить среднюю высоту определенного вида растений и создать следующий доверительный интервал 95%:
95% доверительный интервал = [12,5 дюймов, 60,5 дюймов]
Сравните это со следующим 95% доверительным интервалом:
95% доверительный интервал = [34 дюйма, 39 дюймов]
Второй доверительный интервал гораздо уже и дает нам более точное представление о том, какой может быть истинная средняя численность населения.
Однако, чтобы получить узкий доверительный интервал, нам необходимо увеличить размер выборки, что не всегда практично в реальных исследованиях.
Чтобы проиллюстрировать это, рассмотрим следующий пример.
Пример: расчет доверительного интервала
Чтобы рассчитать доверительный интервал для среднего значения совокупности , мы можем использовать следующую формулу:
Доверительный интервал = x ± z*(s/√ n )
Золото:
- x : выборочное среднее
- z: выбранное значение z
- s: выборочное стандартное отклонение
- n: размер выборки
Используемое вами значение z зависит от выбранного вами уровня достоверности. В следующей таблице показано значение z, соответствующее наиболее распространенным вариантам уровня достоверности:
| Уровень доверия | значение z |
|---|---|
| 0,90 | 1645 |
| 0,95 | 1,96 |
| 0,99 | 2,58 |
Например, предположим, что мы собираем случайную выборку из 25 растений со следующей информацией:
- Размер выборки n = 25
- Средняя высота образца x = 36,5 дюймов
- Выборочное стандартное отклонение s = 18,5 дюймов.
Вот как можно рассчитать 95% доверительный интервал для истинной средней численности населения:
95% доверительный интервал: 36,5 ± 1,96*(18,5/√ 25 ) = [29,248, 43,752]
Мы интерпретируем этот интервал как означающий, что мы на 95% уверены, что истинная средняя высота популяции этого вида растений составляет от 29,248 до 43,752 дюймов.
Теперь предположим, что мы собираем следующую случайную выборку из 100 растений со следующей информацией:
- Размер выборки n = 100
- Средняя высота образца x = 36,5 дюймов
- Выборочное стандартное отклонение s = 18,5 дюймов.
Вот как можно рассчитать 95% доверительный интервал для истинной средней численности населения:
95% доверительный интервал: 36,5 ± 1,96*(18,5/√ 100 ) = [32,874, 40,126]
Мы интерпретируем этот интервал как означающий, что мы на 95% уверены, что истинная средняя высота популяции этого вида растений составляет от 32,874 до 40,126 дюймов.
Обратите внимание: просто увеличив размер выборки, мы смогли получить более узкий доверительный интервал для среднего значения генеральной совокупности.
В реальной ситуации исследователь предпочел бы этот второй интервал, поскольку он дает ему более точное представление о диапазоне значений, которые могут содержать истинные средние значения совокупности.
Однако сбор выборки большего размера зачастую требует больше времени и ресурсов, поэтому в действительности это не всегда практично.
Также имейте в виду, что некоторые наборы данных просто имеют большую изменчивость данных, что приводит к высоким значениям стандартного отклонения выборки. Это естественным образом приводит к широким доверительным интервалам.
Таким образом, чтобы создать «узкий» доверительный интервал, единственная переменная, которую исследователи могут фактически контролировать, — это размер выборки.
Заключение
Вот краткое изложение основных моментов, затронутых в этой статье:
1. Исследователи часто считают «хорошим» доверительным интервалом узкий интервал.
2. Увеличивая размер используемой выборки, исследователи могут получить более узкие доверительные интервалы.
3. То, что считается «узким» доверительным интервалом, варьируется от поля к полю, поскольку некоторые типы данных естественным образом демонстрируют более высокую изменчивость, чем другие.
Связанный: Взаимосвязь между размером выборки и погрешностью
Дополнительные ресурсы
В следующих руководствах представлена дополнительная информация о доверительных интервалах:
Введение в доверительные интервалы
Как сообщить о доверительных интервалах
4 примера доверительных интервалов в реальной жизни