Доверительный интервал для разницы в пропорциях


Доверительный интервал (ДИ) для разницы в пропорциях — это диапазон значений, который может содержать истинную разницу между двумя долями населения с определенным уровнем достоверности.

В этом руководстве объясняется следующее:

  • Мотивация создания этого доверительного интервала.
  • Формула для создания этого доверительного интервала.
  • Пример того, как рассчитать этот доверительный интервал.
  • Как интерпретировать этот доверительный интервал.

ДИ за разницу в пропорциях: мотивация

Исследователи часто хотят оценить разницу между двумя долями населения. Чтобы оценить эту разницу, они соберут случайную выборку из каждой популяции и рассчитают долю для каждой выборки. Затем они могут сравнить разницу между двумя пропорциями.

Однако они не могут знать наверняка, соответствует ли разница между долями выборки истинной разнице между долями населения. Вот почему они могут создать доверительный интервал для разницы между двумя пропорциями. Это обеспечивает диапазон значений, которые могут содержать истинную разницу между пропорциями населения.

Например, предположим, что мы хотим оценить разницу между долей жителей, поддерживающих определенный закон в округе А, и долей жителей, поддерживающих закон в округе Б.

Поскольку в каждом округе проживают тысячи жителей, было бы слишком много времени и денег, чтобы обследовать каждого отдельного жителя в каждом округе.

Вместо этого мы могли бы взять простую случайную выборку жителей из каждого округа и использовать долю в пользу закона в каждой выборке, чтобы оценить истинную разницу в пропорциях между двумя округами:

Поскольку наши выборки являются случайными, нет гарантии, что разница в пропорциях между двумя выборками точно соответствует разнице в пропорциях между двумя популяциями. Итак, чтобы уловить эту неопределенность, мы можем создать доверительный интервал, содержащий диапазон значений, который, вероятно, будет содержать истинную разницу в пропорциях между двумя популяциями.

ДИ для разницы пропорций: формула

Мы используем следующую формулу для расчета доверительного интервала для разницы между двумя долями населения:

Доверительный интервал = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )

Золото:

  • p 1 , p 2 : доля образца 1, доля образца 2.
  • z: z-критическое значение, основанное на уровне достоверности.
  • n 1 , n 2 : размер выборки 1, размер выборки 2

Используемое вами значение z зависит от выбранного вами уровня достоверности. В следующей таблице показано значение z, соответствующее наиболее распространенным вариантам уровня достоверности:

Уровень доверия значение z
0,90 1645
0,95 1,96
0,99 2,58

Обратите внимание, что более высокие уровни достоверности соответствуют большим значениям z, что приводит к более широким доверительным интервалам. Это означает, что, например, доверительный интервал 95 % будет шире доверительного интервала 90 % для того же набора данных.

CI для разницы в пропорциях: пример

Предположим, мы хотим оценить разницу между долей жителей, поддерживающих определенный закон в округе А, по сравнению с долей жителей, поддерживающих закон в округе Б. Вот сводные данные для каждой выборки:

Образец 1:

  • п 1 = 100
  • p 1 = 0,62 (т.е. 62 жителя из 100 поддерживают закон)

Образец 2:

  • п2 = 100
  • p 2 = 0,46 (т.е. 46 жителей из 100 поддерживают закон)

Вот как найти разные доверительные интервалы для разницы в пропорциях населения:

90% доверительный интервал:

(0,62–0,46) +/- 1,645*√(0,62(1–0,62)/100 + 0,46(1–0,46)/100) = [0,0456, 0,2744]

95% доверительный интервал:

(0,62–0,46) +/- 1,96*√(0,62(1–0,62)/100 + 0,46(1–0,46)/100) = [0,0236, 0,2964]

99% доверительный интервал:

(0,62-0,46) +/- 2,58*√(0,62(1-0,62)/100 + 0,46(1-0,46)/100) = [-0,0192, 0,3392]

Примечание. Вы также можете найти эти доверительные интервалы с помощью калькулятора доверительного интервала для разницы пропорций .

CI для разницы в пропорциях : интерпретация

Мы интерпретируем доверительный интервал следующим образом:

Существует 95% вероятность того, что доверительный интервал [0,0236, 0,2964] содержит истинную разницу в доле жителей, поддерживающих закон, между двумя округами.

Поскольку этот интервал не содержит значения «0», это означает, что весьма вероятно, что существует истинная разница в доле жителей, поддерживающих этот закон, в округе А по сравнению с округом Б.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *