Доверительный интервал для доли
Доверительный интервал для доли — это диапазон значений, который может содержать долю населения с определенным уровнем достоверности.
В этом руководстве объясняется следующее:
- Мотивация создания доверительного интервала для пропорции.
- Формула для создания доверительного интервала для пропорции.
- Пример того, как рассчитать доверительный интервал для пропорции.
- Как интерпретировать доверительный интервал для пропорции.
Доверительный интервал для доли: мотивация
Причина создания доверительного интервала для доли состоит в том, чтобы уловить нашу неопределенность при оценке доли населения.
Например, предположим, что мы хотим оценить долю людей в определенном округе, которые поддерживают определенный закон. Поскольку в округе проживают тысячи жителей, было бы слишком дорого и отнимать много времени, чтобы обходить всех жителей и спрашивать их позицию по закону.
Вместо этого мы могли бы выбрать простую случайную выборку жителей и спросить каждого, поддерживают ли они закон:
Поскольку мы выбираем случайную выборку жителей, нет никакой гарантии, что доля жителей в выборке, поддерживающих закон, будет точно соответствовать доле жителей всего округа, которые поддерживают закон.
Итак, чтобы уловить эту неопределенность, мы можем создать доверительный интервал, содержащий диапазон значений, который, вероятно, будет содержать истинную долю жителей, поддерживающих закон во всем округе.
Доверительный интервал для доли: формула
Мы используем следующую формулу для расчета доверительного интервала для доли населения:
Доверительный интервал = p +/- z*√ p(1-p) / n
Золото:
- p: доля выборки
- z: выбранное значение z
- n: размер выборки
Используемое вами значение z зависит от выбранного вами уровня достоверности. В следующей таблице показано значение z, соответствующее наиболее распространенным вариантам уровня достоверности:
Уровень доверия | значение z |
---|---|
0,90 | 1645 |
0,95 | 1,96 |
0,99 | 2,58 |
Обратите внимание, что более высокие уровни достоверности соответствуют большим значениям z, что приводит к более широким доверительным интервалам.
Это означает, что, например, доверительный интервал 95 % будет шире доверительного интервала 90 % для того же набора данных.
Связанный: Что считается хорошим доверительным интервалом?
Доверительный интервал для доли: пример
Предположим, мы хотим оценить долю жителей округа, которые поддерживают определенный закон. Мы выбираем случайную выборку из 100 жителей и спрашиваем их, какова их позиция по закону. Вот результаты:
- Размер выборки n = 100
- Доля в пользу закона p = 0,56
Вот как найти различные доверительные интервалы для доли населения:
90% доверительный интервал: 0,56 +/- 1,645*(√ 0,56(1-0,56)/100 ) = [0,478, 0,642]
95% доверительный интервал: 0,56 +/- 1,96*(√ 0,56(1-0,56)/100 ) = [0,463, 0,657]
99% доверительный интервал: 0,56 +/- 2,58*(√ 0,56(1-0,56)/100 ) = [0,432, 0,688]
Примечание. Вы также можете найти эти доверительные интервалы, используя доверительный интервал для калькулятора пропорций .
Доверительный интервал для пропорции: интерпретация
Мы интерпретируем доверительный интервал следующим образом:
Существует 95% вероятность того, что доверительный интервал [0,463, 0,657] содержит истинную долю жителей, поддерживающих этот закон.
Другой способ сказать то же самое состоит в том, что существует только 5%-ная вероятность того, что истинная доля населения находится за пределами 95%-ного доверительного интервала.
То есть существует лишь 5-процентная вероятность того, что истинная доля жителей округа, поддерживающих закон, составит менее 46,3 процента или более 65,7 процента.