Проверка гипотез и доверительный интервал: в чем разница?
Двумя наиболее часто используемыми процедурами в статистике являются проверка гипотез и доверительные интервалы .
Вот разница между ними:
- Проверка гипотезы — это формальный статистический тест, используемый для определения того, верна ли гипотеза о параметре совокупности.
- Доверительный интервал — это диапазон значений, который может содержать параметр совокупности с определенным уровнем достоверности.
В этом руководстве представлен краткий обзор каждого метода, а также их сходства и различия.
Основы проверки гипотез
Тестовая гипотеза используется для проверки того, верна ли гипотеза о параметре совокупности .
Чтобы выполнить проверку гипотез в реальном мире, исследователи получат случайную выборку населения и выполнят проверку гипотезы на выборочных данных, используя нулевую и альтернативную гипотезу:
- Нулевая гипотеза (H 0 ): данные выборки получены исключительно случайно.
- Альтернативная гипотеза ( HA ): на данные выборки влияет неслучайная причина.
Если значение p проверки гипотезы ниже определенного уровня значимости (например, α = 0,05), то мы можем отвергнуть нулевую гипотезу и сделать вывод, что у нас есть достаточные доказательства, чтобы утверждать, что альтернативная гипотеза верна.
Пример проверки гипотезы
Предположим, производственный завод хочет проверить, меняет ли новый метод количество бракованных изделий, производимых в месяц, которое в настоящее время составляет 250.
Чтобы проверить это, они могут измерить среднее количество неисправных виджетов, созданных до и после использования нового метода в течение месяца.
Они могут выполнить проверку гипотезы, используя следующие гипотезы:
- H 0 : µ после = µ до (среднее количество дефектных виджетов одинаково до и после использования нового метода)
- H A : μ после ≠ μ до (среднее количество произведенных дефектных виджетов различно до и после использования нового метода)
Допустим, они проводят t-тест для одной выборки и получают значение p 0,0032.
Поскольку это значение p меньше α = 0,05, предприятие может отвергнуть нулевую гипотезу и сделать вывод, что новый метод приводит к изменению количества дефектных изделий, производимых в месяц.
Основы доверительных интервалов
Доверительный интервал — это диапазон значений, который может содержать параметр совокупности с определенным уровнем достоверности.
Чтобы рассчитать реальный доверительный интервал, исследователи получат случайную выборку населения и используют следующую формулу для расчета доверительного интервала для среднего значения совокупности:
Доверительный интервал = x +/- z*(s/√ n )
Золото:
- x : образец означает
- z: выбранное значение z
- s: выборочное стандартное отклонение
- n: размер выборки
Используемое вами значение z зависит от выбранного вами уровня достоверности. В следующей таблице показано значение z, соответствующее наиболее распространенным вариантам уровня достоверности:
Уровень доверия | значение z |
---|---|
0,90 | 1645 |
0,95 | 1,96 |
0,99 | 2,58 |
Пример доверительного интервала
Предположим, биолог хочет оценить средний вес черепах в определенной популяции и собирает случайную выборку черепах со следующей информацией:
- Размер выборки n = 25
- Средний вес выборки x = 300
- Выборочное стандартное отклонение s = 18,5
Вот как можно рассчитать 90% доверительный интервал для истинного среднего веса населения:
90% доверительный интервал: 300 +/- 1,645*(18,5/√25) = [293,91, 306,09]
Биолог может быть на 90% уверен, что фактический средний вес черепахи в этой популяции составляет от 293,1 до 306,09 фунтов.
Проверка гипотез и доверительный интервал: когда использовать каждый из них
Решение использовать проверку гипотезы или доверительный интервал зависит от вопроса, на который вы пытаетесь ответить.
Вы должны использовать доверительный интервал , если хотите оценить значение параметра совокупности.
Вам следует использовать проверку гипотез , когда вы хотите определить, верна ли гипотеза о параметре совокупности.
Чтобы проверить свои знания о том, когда использовать каждую процедуру, рассмотрите следующие сценарии.
Сценарий 1: Часы, потраченные на учебу
Предположим, университетский исследователь хочет измерить среднее количество часов, которые студенты тратят на учебу в неделю.
Какую процедуру ей следует использовать, чтобы ответить на этот вопрос?
Ей следует использовать доверительный интервал , поскольку она хочет оценить значение параметра совокупности.
Сценарий 2: Новый препарат
Предположим, врач хочет проверить, способен ли новый препарат снизить кровяное давление больше, чем нынешний стандартный препарат.
Какую процедуру ему следует использовать, чтобы ответить на этот вопрос?
Ему следует использовать проверку гипотез, потому что он хочет понять, верна или нет конкретная гипотеза, касающаяся параметра совокупности.
Дополнительные ресурсы
В следующих руководствах представлена дополнительная информация о проверке гипотез :
Введение в проверку гипотез
Введение в одновыборочный t-критерий
Введение в двухвыборочный t-критерий
Знакомство с t-критерием парных выборок
В следующих руководствах представлена дополнительная информация о доверительных интервалах :
Введение в доверительные интервалы
Доверительный интервал для среднего значения
Доверительный интервал для доли