Критерий хи-квадрат и т-тест: в чем разница?


Критерии хи-квадрат и t-тесты — два наиболее распространенных типа статистических тестов. Поэтому важно понимать разницу между этими двумя тестами и знать, когда использовать каждый из них в зависимости от проблемы, на которую вы хотите ответить.

В этом руководстве представлено простое объяснение разницы между двумя тестами, а также того, когда их использовать.

Тест хи-квадрат

На самом деле существует несколько различных версий теста хи-квадрат, но наиболее распространенным является критерий независимости хи-квадрат .

Определение

Мы используем тест хи-квадрат на независимость , когда хотим формально проверить, существует ли статистически значимая связь между двумя категориальными переменными.

Гипотезы проверки следующие:

Нулевая гипотеза (H 0 ): Между двумя переменными нет значимой связи.

Альтернативная гипотеза: (Ха): Между двумя переменными существует значительная связь.

Примеры

Вот несколько примеров того, когда мы можем использовать критерий хи-квадрат для определения независимости:

Пример 1: Мы хотим знать, существует ли статистически значимая связь между полом (мужчина, женщина) и предпочтениями политических партий (республиканец, демократ, независимый). Чтобы проверить это, мы могли бы опросить 100 случайных людей и записать их пол и предпочтения в отношении политических партий. Затем мы можем выполнить тест хи-квадрат, чтобы определить, существует ли статистически значимая связь между полом и предпочтениями политических партий.

Пример 2: Мы хотим знать, существует ли статистически значимая связь между уровнем класса (первокурсник, второкурсник, младший, старший) и любимым жанром кино (триллер, драма, вестерн). Чтобы проверить это, мы могли бы опросить 100 случайных учеников каждого класса определенной школы и записать их любимый жанр фильмов. Затем мы можем выполнить критерий независимости хи-квадрат, чтобы определить, существует ли статистически значимая связь между уровнем обучения и любимым жанром фильма.

Пример 3: Мы хотим знать, существует ли статистически значимая связь между любимым видом спорта человека (баскетбол, бейсбол, футбол) и местом, где он вырос (город, сельская местность). Чтобы проверить это, мы могли бы опросить 100 случайных людей и спросить их, в каком месте они выросли и какой у них любимый вид спорта. Далее мы можем провести тест хи-квадрат, чтобы определить, существует ли статистически значимая связь между любимым видом спорта человека и местом, где он вырос.

Гипотезы

Прежде чем мы сможем выполнить тест хи-квадрат на независимость, мы должны сначала убедиться, что выполняются следующие предположения, чтобы гарантировать достоверность нашего теста:

  • Случайная выборка: для сбора данных из обеих выборок следует использовать случайную выборку или случайный эксперимент.
  • Категориальность: переменные, которые мы изучаем, должны быть категориальными.
  • Размер: ожидаемое количество наблюдений на каждом уровне переменной должно быть не менее 5.

Если эти предположения подтвердятся, мы сможем провести тест.

t-тест

Существует также несколько различных версий t-критерия, но наиболее распространенным является t-критерий разницы средних значений .

Определение

Мы используем t-тест для определения разницы средних значений , когда хотим формально проверить, существует ли статистически значимая разница между двумя средними значениями генеральной совокупности.

Гипотезы проверки следующие:

Нулевая гипотеза (H 0 ): средние значения двух популяций равны.

Альтернативная гипотеза: (Ха): средние значения двух популяций не равны.

Примечание. Можно проверить, является ли одно среднее значение совокупности выше или ниже другого, но наиболее распространенной нулевой гипотезой является то, что эти два средних значения равны.

Примеры

Вот несколько примеров того, когда мы можем использовать t-критерий для определения разницы в средних значениях:

Пример 1: Мы хотим знать, приводит ли диета А или диета Б к большей потере веса. Мы случайным образом распределяем 100 человек на диету А в течение двух месяцев и еще 100 человек на диету Б в течение двух месяцев. Мы можем провести t-тест, чтобы определить, существует ли статистически значимая разница в средней потере веса между двумя группами.

Пример 2: Мы хотим знать, приводят ли два разных учебных плана к разным результатам экзаменов для учащихся. Мы случайным образом распределяем 50 студентов для использования одного плана обучения и 50 студентов для использования другого плана обучения в течение одного месяца перед экзаменом. Мы можем провести t-тест, чтобы определить разницу в средних значениях и определить, существует ли статистически значимая разница в средних баллах экзамена между двумя планами обучения.

Пример 3. Мы хотим знать, имеют ли учащиеся двух разных школ одинаковый средний рост. Мы измеряем рост 100 случайных учеников из одной школы и 100 случайных учеников из другой школы. Мы можем провести t-тест для определения разницы в средних значениях, чтобы определить, существует ли статистически значимая разница в среднем росте учащихся между двумя школами.

Гипотезы

Прежде чем мы сможем выполнить проверку гипотезы о разнице между двумя средними значениями генеральной совокупности, мы должны сначала убедиться, что выполняются следующие условия, чтобы гарантировать достоверность нашей проверки гипотезы:

  • Случайный выбор: для сбора данных для обеих выборок следует использовать случайную выборку или случайный эксперимент.
  • Нормальное: Распределение выборки нормальное или приблизительно нормальное.
  • Независимость: эти две выборки независимы.

Если эти предположения удовлетворены, мы можем выполнить проверку гипотезы.

Как узнать, когда использовать каждый тест

Вот краткое описание каждого теста:

Критерий хи-квадрат на независимость: позволяет проверить, существует ли статистически значимая связь между двумя категориальными переменными. Когда вы отвергаете нулевую гипотезу с помощью критерия независимости хи-квадрат, это означает, что между двумя переменными существует значительная связь.

Разница в средних t-тесте: позволяет проверить, существует ли статистически значимая разница между двумя средними значениями генеральной совокупности. Когда вы отвергаете нулевую гипотезу t-критерия о разнице средних значений, это означает, что средние значения двух популяций не равны.

Самый простой способ узнать, следует ли использовать тест хи-квадрат вместо t-теста, — это просто посмотреть на типы переменных, с которыми вы работаете.

Если у вас есть две переменные, обе из которых являются категориальными, то есть их можно отнести к таким категориям, как «мужчина », « женщина » и «республиканец », «демократ », « независимый », тогда вам следует использовать критерий хи-квадрат.

Но если одна переменная является категориальной (например, тип плана обучения — план 1 или план 2), а другая — непрерывной (например, балл на экзамене — измеряется от 0 до 100), тогда вам следует использовать t-критерий.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *