Доверительный интервал для разницы в пропорциях

В этой статье объясняется, что такое доверительный интервал для разницы пропорций в статистике и для чего он используется. Вы также узнаете, как рассчитать доверительный интервал для разницы двух пропорций, и пошаговое решение упражнения.

Каков доверительный интервал разницы в пропорциях?

Доверительный интервал разницы в пропорциях — это интервал, обеспечивающий диапазон допустимых значений, между которыми с определенным уровнем достоверности укладывается значение разницы между долями двух популяций.

Например, если доверительный интервал для разницы между долями двух популяций при доверительном уровне 95% равен (0,07, 15), это означает, что разница между двумя долями населения будет составлять от 7% до 15% с вероятностью 95%.

Поэтому в статистике доверительный интервал разницы в пропорциях используется для оценки двух значений, между которыми связывается разница между двумя долями населения. Поэтому собираются две выборки, и по этим данным можно приблизительно оценить разницу между долями популяций.

Формула доверительного интервала для разницы в пропорциях

Формула расчета доверительного интервала для разницы пропорций с уровнем достоверности 1-α выглядит следующим образом:

\displaystyle (\widehat{p_1}-\widehat{p_2})\pm Z_{\alpha/2}\sqrt{\frac{\widehat{p_1}(1-\widehat{p_1})}{n_1}+\frac{\widehat{p_2}(1-\widehat{p_2})}{n_2}}

Золото:

  • \widehat{p_i}

    – это выборочная доля i.

  • n_i

    размер выборки i.

  • Z_{\alpha/2}

    — квантиль стандартного нормального распределения, соответствующий вероятности α/2. Для больших размеров выборки и уровня достоверности 95% оно обычно близко к 1,96, а для уровня достоверности 99% оно обычно близко к 2,576.

Конкретный пример доверительного интервала для разницы в пропорциях

Увидев определение доверительного интервала разницы в пропорциях и какова его формула, мы увидим конкретный пример того, как рассчитывается доверительный интервал для разницы в пропорциях.

  • Мы хотим провести статистическое исследование доли левшей, точнее, мы хотим узнать разницу между долей левшей между мужчинами и женщинами. Для этого взята выборка из 60 мужчин и выборка из 67 женщин, среди которых 5 мужчин и 7 женщин левши. Каков доверительный интервал для разницы в пропорциях при уровне достоверности 95%?

Для начала нам необходимо посчитать долю левшей для каждой статистической выборки:

\widehat{p_1}=\cfrac{5}{60}=0,083

\widehat{p_2}=\cfrac{7}{67}=0,104

Как мы видели в разделе выше, формула для определения доверительного интервала разницы в пропорциях выглядит так:

\displaystyle (\widehat{p_1}-\widehat{p_2})\pm Z_{\alpha/2}\sqrt{\frac{\widehat{p_1}(1-\widehat{p_1})}{n_1}+\frac{\widehat{p_2}(1-\widehat{p_2})}{n_2}}

Итак, чтобы найти доверительный интервал разницы пропорций, нам необходимо определить значение Z α /2. Для этого воспользуемся стандартной таблицей нормального распределения .

1-\alpha=0,95 \ \color{orange}\bm{\longrightarrow}\color{black} \ \alpha=0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \alpha/2=0,025

\begin{array}{c}Z_{\alpha/2}= \ \color{orange}\bm{?}\\[4ex]Z_{0,025}=1,96\end{array}

Наконец, подставляем данные в формулу и вычисляем доверительный интервал разницы пропорций:

\displaystyle (\widehat{p_1}-\widehat{p_2})\pm Z_{\alpha/2}\sqrt{\frac{\widehat{p_1}(1-\widehat{p_1})}{n_1}+\frac{\widehat{p_2}(1-\widehat{p_2})}{n_2}}

\displaystyle (0,083-0,104)\pm 1,96\cdot \sqrt{\frac{0,083\cdot(1-0,083)}{60}+\frac{0,104\cdot(1-0,104)}{67}}

\displaystyle -0,021\pm  0,101

Короче говоря, доверительный интервал для разницы в пропорциях задач равен:

(-0,122 \ , \ 0,08)

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *