Доверительный интервал

В этой статье объясняется, что такое доверительный интервал в статистике и для чего он используется. Вы также узнаете о факторах, влияющих на доверительные интервалы, и о том, как рассчитывается доверительный интервал.

Что такое доверительный интервал?

В статистике доверительный интервал — это интервал, дающий аппроксимацию значений, между которыми связывается значение параметра совокупности с определенным уровнем достоверности. Наиболее распространенные доверительные интервалы имеют уровень достоверности 95% или 99%.

Например, если доверительный интервал для среднего значения популяции с уровнем достоверности 95% равен (3,7), это означает, что среднее значение изучаемой популяции будет находиться в диапазоне от 3 до 7 с вероятностью 95%.

Поэтому доверительный интервал используется для оценки двух значений, между которыми находится параметр совокупности. Как правило, значения параметров совокупности неизвестны, поэтому на основе данных выборки рассчитывается доверительный интервал, чтобы получить оценку параметров совокупности.

Факторы, влияющие на доверительный интервал

Увидев определение доверительного интервала, мы увидим, каковы факторы, от которых зависят доверительные интервалы, чтобы лучше понять эту концепцию.

  • Размер выборки : количество изученных наблюдений влияет на точность доверительного интервала, поскольку чем больше у нас данных, тем больше можно оценить значения. В общем, чем больше размер выборки, тем меньше ширина доверительного интервала.
  • Погрешность : чем больше допустимая ошибка, тем больше доверительный интервал и, следовательно, тем больше вероятность того, что истинное значение параметра лежит в пределах доверительного интервала. Однако погрешность снижает точность доверительного интервала.
  • Уровень уверенности : вероятность того, что оценка статистики населения находится в пределах доверительного интервала. Обычно уровень достоверности интервала обозначается как 1-α и выражается в процентах. Высокий уровень достоверности увеличивает вероятность того, что истинное значение находится между пределами интервала, но также увеличивает ширину интервала.
  • Оценочный параметр : доверительный интервал зависит от аппроксимируемого параметра. Фактически, формула, которую следует использовать для расчета доверительного интервала, зависит от приблизительного параметра.

Как рассчитать доверительный интервал

Формула, которую следует применять для расчета каждого типа доверительного интервала, представлена ниже, поскольку в зависимости от того, хотим ли мы определить доверительный интервал для среднего значения, дисперсии или доли, используемая формула будет разной.

Доверительный интервал для среднего значения

Начиная с того, что процесс набора переменной происходит следующим образом:

Z=\cfrac{X-\mu}{\displaystyle\frac{\sigma}{\sqrt{n}}} \sim N(0,1)

Доверительный интервал для среднего значения рассчитывается путем сложения и вычитания из выборочного среднего значения Z α/2 , умноженного на стандартное отклонение (σ) и деленного на квадратный корень из размера выборки (n). Следовательно, формула для расчета доверительного интервала среднего такова:

\displaystyle \left(\overline{x}-z_{\alpha/2}\cdot \frac{\sigma}{\sqrt{n}} \ , \ \overline{x}+z_{\alpha/2}\cdot \frac{\sigma}{\sqrt{n}} \right)

Для больших размеров выборки и уровня достоверности 95 % критическое значение составляет Z α/2 = 1,96, а для уровня достоверности 99 % критическое значение составляет Z α/2 = 2,576.

Приведенная выше формула используется, когда известна дисперсия генеральной совокупности. Однако если дисперсия генеральной совокупности неизвестна, что является наиболее распространенным случаем, доверительный интервал для среднего значения рассчитывается по следующей формуле:

\displaystyle \left(\overline{x}-t_{\alpha/2}\cdot \frac{s}{\sqrt{n}} \ , \ \overline{x}+t_{\alpha/2}\cdot \frac{s}{\sqrt{n}} \right)

Золото:

  • \overline{x}

    это образец означает.

  • t_{\alpha/2}

    — значение t-распределения Стьюдента n-1 степеней свободы с вероятностью α/2.

  • s

    — выборочное стандартное отклонение.

  • n

    это размер выборки.

доверительный интервал

Доверительный интервал для дисперсии

Для расчета доверительного интервала дисперсии совокупности используется распределение хи-квадрат. Более конкретно, формула для расчета доверительного интервала дисперсии :

\displaystyle \left( (n-1)\frac{s^2}{\chi_{n-1;\alpha/2}} \ , \ (n-1)\frac{s^2}{\chi_{n-1;1-\alpha/2}}\right)

Золото:

  • n

    это размер выборки.

  • s

    — выборочное стандартное отклонение.

  • \chi_{n-1;\alpha/2}

    — значение распределения хи-квадрат с n-1 степенями свободы для вероятности меньше α/2.

  • \chi_{n-1;1-\alpha/2}

    — это значение распределения хи-квадрат с n-1 степенями свободы для вероятности, большей 1-α/2.

Доверительный интервал для доли

Доверительный интервал для доли рассчитывается путем сложения и вычитания из выборочной доли значения Z α/2 , умноженного на квадратный корень из выборочной доли (p), умноженного на 1-p и разделенного на размер выборки (n). Следовательно, формула расчета доверительного интервала для доли имеет вид:

\displaystyle \left(p-Z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}\ , \ p+Z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}\right)

Золото:

  • p

    – это доля выборки.

  • n

    это размер выборки.

  • Z_{\alpha/2}

    — квантиль стандартного нормального распределения, соответствующий вероятности α/2. Для больших размеров выборки и уровня достоверности 95% оно обычно близко к 1,96, а для уровня достоверности 99% оно обычно близко к 2,576.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *