Когда отвергать нулевую гипотезу? (3 примера)
Проверка гипотезы — это формальный статистический тест, который мы используем, чтобы отвергнуть или не отвергнуть статистическую гипотезу.
Для проверки гипотез мы всегда используем следующие шаги:
Шаг 1: Сформулируйте нулевую и альтернативную гипотезы.
Нулевая гипотеза , обозначаемая H0 , представляет собой гипотезу о том, что выборочные данные получены исключительно случайно.
Альтернативная гипотеза , обозначаемая HA , представляет собой гипотезу о том, что на выборочные данные влияет неслучайная причина.
2. Определите уровень значимости для использования.
Определитесь с уровнем значимости. Обычно выбираются значения .01, .05 и .1.
3. Рассчитайте тестовую статистику и значение p.
Используйте данные выборки, чтобы вычислить тестовую статистику и соответствующее значение p .
4. Отклонить или не отвергать нулевую гипотезу.
Если значение p ниже уровня значимости, вы отвергаете нулевую гипотезу.
Если значение p не ниже уровня значимости, вы не сможете отвергнуть нулевую гипотезу.
Чтобы запомнить это правило, вы можете использовать следующую изящную строку:
«Если p слабое, ноль должен исчезнуть».
Другими словами, если значение p достаточно низкое, мы должны отвергнуть нулевую гипотезу.
Следующие примеры показывают, когда отклонять (или не отклонять) нулевую гипотезу для наиболее распространенных типов проверки гипотез.
Пример 1: t-критерий для одной выборки
Одновыборочный t-критерий используется для проверки того, соответствует ли среднее значение совокупности определенному значению.
Например, предположим, что мы хотим знать, составляет ли средний вес черепах определенного вида 310 фунтов.
Мы выходим и собираем простую случайную выборку из 40 черепах со следующей информацией:
- Размер выборки n = 40
- Средний вес выборки x = 300
- Выборочное стандартное отклонение s = 18,5
Мы можем использовать следующие шаги для выполнения одновыборочного t-теста:
Шаг 1. Сформулируйте нулевую и альтернативную гипотезы.
Мы проведем одновыборочный t-тест со следующими гипотезами:
- H 0 : μ = 310 (в среднем по популяции равно 310 книгам)
- H A : μ ≠ 310 (средняя численность населения не равна 310 фунтам)
2. Определите уровень значимости для использования.
Мы выберем уровень значимости 0,05 .
3. Рассчитайте тестовую статистику и значение p.
Мы можем ввести числа для размера выборки, среднего значения выборки и стандартного отклонения выборки в этот калькулятор t-критерия для одной выборки, чтобы рассчитать статистику теста и значение p:
- статистика t-теста: -3,4187
- Двустороннее значение p: 0,0015.
4. Отклонить или не отвергать нулевую гипотезу.
Поскольку значение p (0,0015) меньше уровня значимости (0,05), мы отвергаем нулевую гипотезу .
Мы пришли к выводу, что имеется достаточно доказательств, чтобы утверждать, что средний вес черепах в этой популяции не равен 310 фунтам.
Пример 2. Двухвыборочный t-критерий
Двухвыборочный t-критерий используется для проверки того, равны ли средние значения двух совокупностей или нет.
Например, предположим, что мы хотим узнать, равен ли средний вес двух разных видов черепах.
Мы собираем простую случайную выборку из каждой популяции со следующей информацией:
Образец 1:
- Размер выборки n 1 = 40
- Средний вес выборки x 1 = 300
- Стандартное отклонение выборки s 1 = 18,5
Образец 2:
- Размер выборки n 2 = 38
- Средний вес выборки х 2 = 305
- Стандартное отклонение выборки s 2 = 16,7
Мы можем использовать следующие шаги для выполнения двухвыборочного t-теста:
Шаг 1. Сформулируйте нулевую и альтернативную гипотезы.
Мы проведем двухвыборочный t-критерий со следующими предположениями:
- H 0 : μ 1 = μ 2 (два средних значения совокупности равны)
- H 1 : μ 1 ≠ μ 2 (два средних значения совокупности не равны)
2. Определите уровень значимости для использования.
Мы выберем уровень значимости 0,10 .
3. Рассчитайте тестовую статистику и значение p.
Мы можем ввести числа для размеров выборки, средних значений выборки и стандартных отклонений выборки в этот калькулятор t-критерия для двух выборок, чтобы рассчитать статистику теста и значение p:
- статистика t-теста: -1,2508
- Двустороннее значение p: 0,2149.
4. Отклонить или не отвергать нулевую гипотезу.
Поскольку значение p (0,2149) не меньше уровня значимости (0,10), мы не можем отвергнуть нулевую гипотезу .
У нас нет достаточных доказательств, чтобы сказать, что средний вес черепах этих двух популяций различен.
Пример 3: t-критерий для парных выборок
T-критерий парных выборок используется для сравнения средних значений двух выборок, когда каждое наблюдение в одной выборке может быть связано с наблюдением в другой выборке.
Например, предположим, что мы хотим знать, способна ли определенная программа тренировок увеличить максимальный вертикальный прыжок баскетболистов колледжа.
Чтобы проверить это, мы можем набрать простую случайную выборку из 20 баскетболистов колледжей и измерить каждый из их максимальных вертикальных прыжков. Затем мы можем предложить каждому игроку использовать тренировочную программу в течение месяца, а затем снова измерить свой максимальный вертикальный прыжок в конце месяца:
Мы можем использовать следующие шаги для выполнения t-теста для парных выборок:
Шаг 1. Сформулируйте нулевую и альтернативную гипотезы.
Мы проведем t-тест для парных выборок со следующими гипотезами:
- H 0 : μ до = μ после (два средних значения совокупности равны)
- H 1 : μ до ≠ μ после (два средних значения совокупности не равны)
2. Определите уровень значимости для использования.
Мы выберем уровень значимости 0,01 .
3. Рассчитайте тестовую статистику и значение p.
Мы можем подключить необработанные данные из каждого образца в этот калькулятор t-теста для парных образцов , чтобы рассчитать статистику теста и значение p:
- статистика t-теста: -3,226
- Двустороннее значение p: 0,0045.
4. Отклонить или не отвергать нулевую гипотезу.
Поскольку значение p (0,0045) меньше уровня значимости (0,01), мы отвергаем нулевую гипотезу .
У нас есть достаточно доказательств, чтобы сказать, что средний вертикальный прыжок до и после участия в тренировочной программе неодинаков.
Бонус: калькулятор правил принятия решений
Вы можете использовать этот калькулятор правил принятия решений , чтобы автоматически определить, следует ли отклонять нулевую гипотезу для проверки гипотезы на основе значения статистики теста.