Введение в проверку гипотез
Статистическая гипотеза – это предположение о параметре совокупности .
Например, можно предположить, что средний рост мужчины в США составляет 70 дюймов.
Гипотеза относительно роста является статистической гипотезой , а истинный средний рост мужчины в Соединенных Штатах является параметром населения .
Проверка гипотезы — это формальный статистический тест, который мы используем, чтобы отвергнуть или не отвергнуть статистическую гипотезу.
Два типа статистических гипотез
Чтобы проверить, верна ли статистическая гипотеза о параметре совокупности, мы получаем случайную выборку из совокупности и выполняем проверку гипотезы на данных выборки.
Существует два типа статистических гипотез:
Нулевая гипотеза , обозначаемая H0 , представляет собой гипотезу о том, что выборочные данные получены исключительно случайно.
Альтернативная гипотеза , обозначаемая H1 или Ha , представляет собой гипотезу о том, что на выборочные данные влияет неслучайная причина.
Проверка гипотезы
Проверка гипотезы включает в себя пять шагов:
1. Сформулируйте гипотезы.
Сформулируйте нулевую и альтернативную гипотезы. Эти две гипотезы должны быть взаимоисключающими, поэтому, если одна верна, другая должна быть ложной.
2. Определите уровень значимости гипотезы.
Определитесь с уровнем значимости. Обычно выбираются значения .01, .05 и .1.
3. Найдите статистику теста.
Найдите статистику теста и соответствующее значение p. Часто мы анализируем среднее значение или пропорцию генеральной совокупности, и общая формула для нахождения тестовой статистики такова: (статистика выборки – параметр совокупности) / (стандартное отклонение статистики)
4. Отклонить или не отвергать нулевую гипотезу.
Используя статистику теста или значение p, определите, можете ли вы отвергнуть нулевую гипотезу на основе уровня значимости.
Значение p говорит нам о силе доказательств, подтверждающих нулевую гипотезу. Если значение p меньше уровня значимости, мы отвергаем нулевую гипотезу.
5. Интерпретируйте результаты.
Интерпретируйте результаты проверки гипотезы в контексте заданного вопроса.
Два типа ошибок принятия решений
При проверке гипотезы можно допустить два типа ошибок принятия решений:
Ошибка типа I: вы отвергаете нулевую гипотезу, хотя она на самом деле верна. Вероятность совершения ошибки I рода равна уровню значимости, часто называемому альфа и обозначаемому альфа.
Ошибка второго рода: вы не можете отвергнуть нулевую гипотезу, хотя она на самом деле ложна. Вероятность совершения ошибки второго рода называется тестовой мощностью или бета , обозначаемой β.
Односторонние и двусторонние тесты
Статистическая гипотеза может быть односторонней или двусторонней.
Односторонняя гипотеза предполагает утверждение «больше» или «меньше».
Например, предположим, что средний рост мужчины в Соединенных Штатах составляет 70 дюймов или больше. Нулевая гипотеза будет H0: µ ≥ 70 дюймов, а альтернативная гипотеза будет Ha: µ < 70 дюймов.
Двусторонняя гипотеза предполагает утверждение «равно» или «не равно».
Например, предположим, что средний рост мужчины в Соединенных Штатах составляет 70 дюймов. Нулевая гипотеза будет H0: µ = 70 дюймов, а альтернативная гипотеза будет Ha: µ ≠ 70 дюймов.
Примечание. Знак «равно» всегда включается в нулевую гипотезу, независимо от того, равен ли он =, ≥ или ≤.
Связанный: Что такое направленная гипотеза?
Виды проверки гипотез
Существует множество типов проверки гипотез, которые вы можете выполнить в зависимости от типа данных, с которыми вы работаете, и цели вашего анализа.
Следующие руководства содержат объяснение наиболее распространенных типов проверки гипотез:
Введение в одновыборочный t-критерий
Введение в двухвыборочный t-критерий
Знакомство с t-критерием парных выборок
Введение в Z-тест для одной пропорции
Введение в двухпропорциональный Z-тест