Что такое доверительные интервалы?


Часто в статистике нас интересуют измерения параметров популяции , то есть чисел, которые описывают определенные характеристики всей популяции.

Двумя наиболее распространенными параметрами популяции являются:

1. Среднее значение населения: среднее значение переменной в популяции (например, средний рост мужчин в США).

2. Доля населения: доля переменной в населении (например, доля жителей округа, поддерживающих определенный закон).

Даже если мы хотим измерить эти параметры, сбор данных о каждом человеке в популяции для расчета параметра популяции, как правило, обходится слишком дорого и требует много времени.

Вместо этого мы обычно берем случайную выборку из общей численности населения и используем данные выборки для оценки параметра совокупности.

Например, предположим, что мы хотим оценить средний вес черепах определенного вида во Флориде. Поскольку во Флориде обитают тысячи черепах, было бы чрезвычайно много времени и денег, чтобы обойти и взвесить каждую черепаху по отдельности.

Вместо этого мы могли бы взять простую случайную выборку из 50 черепах и использовать средний вес черепах в этой выборке, чтобы оценить истинный средний показатель по популяции:

Пример популяции

Проблема в том, что средний вес черепах в выборке не обязательно точно соответствует среднему весу черепах во всей популяции. Например, мы можем выбрать выборку, полную черепах с небольшим весом, или, может быть, выборку, полную тяжелых черепах.

Чтобы уловить эту неопределенность, мы можем создать доверительный интервал. Доверительный интервал — это диапазон значений, который может содержать параметр совокупности с определенным уровнем достоверности. Он рассчитывается по следующей общей формуле:

Доверительный интервал = (точечная оценка) +/- (критическое значение)* (стандартная ошибка)

Эта формула создает интервал с нижним и верхним пределом, который, вероятно, содержит параметр совокупности с определенным уровнем достоверности.

Доверительный интервал = [нижний предел, верхний предел]

Например, формула для расчета доверительного интервала для среднего значения совокупности:

Доверительный интервал = x +/- z*(s/√ n )

Золото:

  • x : образец означает
  • z: выбранное значение z
  • s: выборочное стандартное отклонение
  • n: размер выборки

Используемое вами значение z зависит от выбранного вами уровня достоверности. В следующей таблице показано значение z, соответствующее наиболее распространенным вариантам уровня достоверности:

Уровень доверия значение z
0,90 1645
0,95 1,96
0,99 2,58

Например, предположим, что мы собираем случайную выборку черепах со следующей информацией:

  • Размер выборки n = 25
  • Средний вес выборки x = 300
  • Выборочное стандартное отклонение s = 18,5

Вот как можно рассчитать 90% доверительный интервал для истинного среднего веса населения:

90% доверительный интервал: 300 +/- 1,645*(18,5/√25) = [293,91, 306,09]

Мы интерпретируем этот доверительный интервал следующим образом:

Существует 90% вероятность того, что доверительный интервал [293,91, 306,09] содержит истинный средний вес популяции черепах.

Другой способ сказать то же самое состоит в том, что существует только 10%-ная вероятность того, что истинное среднее значение генеральной совокупности лежит за пределами 90%-ного доверительного интервала. То есть существует только 10% вероятность того, что фактический средний вес популяции черепах превышает 306,09 фунта или меньше 293,91 фунта.

Ничего не стоит, что есть два числа, которые могут повлиять на размер доверительного интервала:

1. Размер выборки: чем больше размер выборки, тем уже доверительный интервал.

2. Уровень уверенности. Чем выше уровень уверенности, тем шире доверительный интервал.

Типы доверительных интервалов

Существует много типов доверительных интервалов. Вот наиболее часто используемые:

Доверительный интервал для среднего значения

Доверительный интервал для среднего значения — это диапазон значений, который может содержать среднее значение генеральной совокупности с определенным уровнем достоверности. Формула для расчета этого интервала выглядит следующим образом:

Доверительный интервал = x +/- z*(s/√ n )

Золото:

  • x : образец означает
  • z: выбранное значение z
  • s: выборочное стандартное отклонение
  • n: размер выборки

Ресурсы:
Как рассчитать доверительный интервал для среднего значения
Доверительный интервал для среднего калькулятора

Доверительный интервал для разницы между средними значениями

Доверительный интервал (ДИ) для разницы между средними значениями — это диапазон значений, который может содержать истинную разницу между двумя средними значениями совокупности с определенным уровнем достоверности. Формула для расчета этого интервала выглядит следующим образом:

Доверительный интервал = ( x 1x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))

Золото:

  • x 1 , x 2 : среднее значение образца 1, среднее значение образца 2
  • t: t-критическое значение, основанное на уровне достоверности и (n 1 + n 2 -2) степенях свободы.
  • s p 2 : объединенная дисперсия
  • n 1 , n 2 : размер выборки 1, размер выборки 2

Золото:

  • Объединенная дисперсия рассчитывается следующим образом: s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
  • Критическое значение t можно найти с помощью калькулятора обратного распределения t.

Ресурсы:
Как рассчитать доверительный интервал для разницы между средними значениями
Доверительный интервал для расчета разницы между средними значениями

Доверительный интервал для доли

Доверительный интервал для доли — это диапазон значений, который может содержать долю населения с определенным уровнем достоверности. Формула для расчета этого интервала выглядит следующим образом:

Доверительный интервал = p +/- z*(√ p(1-p) / n )

Золото:

  • p: доля выборки
  • z: выбранное значение z
  • n: размер выборки

Ресурсы:
Как рассчитать доверительный интервал для пропорции
Доверительный интервал для калькулятора пропорций

Доверительный интервал для разницы в пропорциях

Доверительный интервал для разницы в пропорциях — это диапазон значений, который с определенной степенью достоверности может содержать истинную разницу между двумя долями населения. Формула для расчета этого интервала выглядит следующим образом:

Доверительный интервал = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )

Золото:

  • p 1 , p 2 : доля образца 1, доля образца 2.
  • z: z-критическое значение, основанное на уровне достоверности.
  • n 1 , n 2 : размер выборки 1, размер выборки 2

Ресурсы:
Как рассчитать доверительный интервал для разницы пропорций
Доверительный интервал для калькулятора разницы пропорций

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *