Тест хі-квадрат і t-тест: у чому різниця?
Тести хі-квадрат і t-тести є двома найпоширенішими типами статистичних тестів. Тому важливо розуміти різницю між цими двома тестами та як знати, коли використовувати кожен залежно від проблеми, на яку ви хочете відповісти.
Цей підручник містить просте пояснення різниці між двома тестами, а також того, коли їх використовувати.
Тест хі-квадрат
Фактично існує кілька різних варіантів тесту хі-квадрат, але найпоширенішим є тест незалежності хі-квадрат .
Визначення
Ми використовуємо тест хі-квадрат на незалежність , коли хочемо формально перевірити, чи існує статистично значущий зв’язок між двома категоріальними змінними.
Перевірені гіпотези такі:
Нульова гіпотеза (H 0 ): Немає істотного зв’язку між двома змінними.
Альтернативна гіпотеза: (Ha): Існує значний зв’язок між двома змінними.
Приклади
Ось кілька прикладів того, коли ми можемо використовувати тест хі-квадрат для визначення незалежності:
Приклад 1. Ми хочемо знати, чи існує статистично значущий зв’язок між статтю (чоловіча, жіноча) та перевагами політичної партії (республіканська, демократична, незалежна). Щоб перевірити це, ми могли б опитати 100 випадкових людей і записати їхню стать і переваги політичних партій. Потім ми можемо виконати тест хі-квадрат, щоб визначити, чи існує статистично значущий зв’язок між статтю та перевагами політичної партії.
Приклад 2. Ми хочемо знати, чи існує статистично значущий зв’язок між рівнем навчання (першокурсник, другокурсник, молодший, старший) і улюбленим жанром фільму (трилер, драма, вестерн). Щоб перевірити це, ми могли б опитати 100 випадкових учнів кожного класу певної школи та записати їхній улюблений жанр фільму. Далі ми можемо виконати тест хі-квадрат незалежності, щоб визначити, чи існує статистично значущий зв’язок між рівнем навчання та улюбленим жанром фільму.
Приклад 3. Ми хочемо знати, чи існує статистично значущий зв’язок між улюбленим видом спорту людини (баскетбол, бейсбол, футбол) і місцем його дитинства (місто, село). Щоб перевірити це, ми могли б опитати 100 випадкових людей і запитати їх, у якому місці вони виросли та який їхній улюблений вид спорту. Далі ми можемо виконати тест хі-квадрат, щоб визначити, чи існує статистично значущий зв’язок між улюбленим видом спорту людини та місцем його дитинства.
Гіпотези
Перш ніж ми зможемо виконати тест хі-квадрат на незалежність, ми повинні спершу переконатися, що виконуються наступні припущення, щоб забезпечити валідність нашого тесту:
- Випадковий: Для збору даних з обох зразків слід використовувати випадкову вибірку або випадковий експеримент.
- Категоричний: Змінні, які ми вивчаємо, мають бути категоричними.
- Розмір: очікувана кількість спостережень на кожному рівні змінної має бути принаймні 5.
Якщо ці припущення підтвердяться, ми зможемо виконати тест.
t-тест
Існує також кілька різних версій t-критерію, але найпоширенішим є t-тест для різниці середніх значень .
Визначення
Ми використовуємо t-тест для різниці середніх значень, коли хочемо офіційно перевірити, чи існує статистично значуща різниця між двома середніми значеннями сукупності.
Перевірені гіпотези такі:
Нульова гіпотеза (H 0 ): середні значення двох сукупностей рівні.
Альтернативна гіпотеза: (Ha): середні значення двох сукупностей не рівні.
Примітка. Можна перевірити, чи одне середнє значення сукупності є вищим або нижчим за інше, але найпоширенішою нульовою гіпотезою є те, що два середні рівні.
Приклади
Ось кілька прикладів того, коли ми можемо використовувати t-тест для різниці середніх значень:
Приклад 1. Ми хочемо знати, чи дієта А чи дієта Б призводить до більшої втрати ваги. Ми випадковим чином розподіляємо 100 людей, які будуть дотримуватися дієти А протягом двох місяців, а ще 100 людей — дотримуватися дієти Б протягом двох місяців. Ми можемо виконати t-тест, щоб визначити, чи є статистично значуща різниця в середній втраті ваги між двома групами.
Приклад 2: ми хочемо знати, чи два різні навчальні плани призводять до різних результатів іспитів для студентів. Ми випадковим чином розподіляємо 50 студентів для використання одного плану навчання та 50 студентів для використання іншого плану навчання протягом одного місяця перед іспитом. Ми можемо виконати t-критерій, щоб визначити різницю в середніх, щоб визначити, чи існує статистично значуща різниця в середніх балах за іспит між двома планами навчання.
Приклад 3: ми хочемо знати, чи учні двох різних шкіл мають однаковий середній зріст. Ми вимірюємо зріст 100 випадкових учнів однієї школи та 100 випадкових учнів іншої школи. Ми можемо виконати t-тест для різниці в середніх показниках, щоб визначити, чи існує статистично значуща різниця в середньому зрості учнів між двома школами.
Гіпотези
Перш ніж ми зможемо виконати перевірку гіпотези щодо різниці між двома середніми сукупностями, ми повинні спершу переконатися, що виконуються наступні умови, щоб забезпечити валідність перевірки нашої гіпотези:
- Випадковий: Для збору даних для обох зразків слід використовувати випадкову вибірку або випадковий експеримент.
- Нормальний: розподіл вибірки нормальний або приблизно нормальний.
- Незалежність: два зразки є незалежними.
Якщо ці припущення задовольняються, ми можемо виконати перевірку гіпотези.
Як дізнатися, коли використовувати кожен тест
Ось короткий опис кожного тесту:
Тест хі-квадрат на незалежність: дозволяє перевірити, чи існує статистично значущий зв’язок між двома категоріальними змінними. Коли ви відхиляєте нульову гіпотезу з тесту хі-квадрат незалежності, це означає, що між двома змінними існує значний зв’язок.
Різниця в середніх значеннях t-тест: дозволяє перевірити, чи існує статистично значуща різниця між двома середніми сукупностями. Коли ви відкидаєте нульову гіпотезу t-критерію для різниці середніх значень, це означає, що середні значення двох сукупностей не рівні.
Найпростіший спосіб дізнатися, чи використовувати тест хі-квадрат чи t-тест, — це просто подивитися на типи змінних, з якими ви працюєте.
Якщо у вас є дві змінні, які обидві є категоричними, тобто їх можна помістити в такі категорії, як чоловіки , жінки та республіканці , демократи , незалежні , тоді вам слід використовувати тест хі-квадрат.
Але якщо одна змінна є категоричною (наприклад, тип плану навчання – або план 1, або план 2), а інша є безперервною (наприклад, оцінка за іспит – вимірюється від 0 до 100), то вам слід використовувати t-тест.