Що таке коваріата в статистиці?


У статистиці дослідники часто бажають зрозуміти зв’язок між однією або декількома пояснювальними змінними та змінною відповіді .

Однак може бути так, що інші змінні можуть впливати на змінну відповіді і не становлять інтересу для дослідників. Ці змінні називаються коваріатами .

Коваріати: змінні, які впливають на змінну відповіді, але не представляють інтересу для дослідження.

Визначення коваріати в статистиці

Наприклад, припустімо, що дослідники хочуть знати, чи призводять три різні методи навчання до різних середніх результатів тестів у певній школі. Методика навчання є пояснювальною змінною, а оцінка за іспит — змінною відповіді.

Проте в цих трьох групах неодмінно будуть відмінності в навчальних здібностях учнів. Якщо це не взяти до уваги, це буде незрозумілою варіацією в рамках дослідження та ускладнить визначення справжнього зв’язку між технікою дослідження та результатами обстеження.

Одним із способів пояснити це може бути використання поточної оцінки студента в класі як коваріати . Загальновідомо, що поточна оцінка студента, ймовірно, корелює з його майбутніми результатами іспиту.

Приклад коваріантів у статистиці

Таким чином, хоча поточна оцінка не є змінною, що представляє інтерес для цього дослідження, її можна включити як коваріату, щоб дослідники могли побачити, чи техніка навчання впливає на результати іспиту, навіть після врахування поточної оцінки студента в класі.

Коваріати найчастіше з’являються в контекстах двох типів: ANOVA (дисперсійний аналіз) і регресії.

Коваріати в ANOVA

Коли ми виконуємо ANOVA (чи то односторонній ANOVA , двосторонній ANOVA чи щось складніше), ми хочемо знати, чи є різниця між середніми значеннями трьох або більше незалежних груп.

У нашому попередньому прикладі ми хотіли зрозуміти, чи є різниця в середніх іспитових балах між трьома різними методами навчання. Щоб зрозуміти це, ми могли б виконати односторонній дисперсійний аналіз.

Однак, оскільки ми знали, що поточна оцінка студента також може вплинути на результати іспиту, ми могли включити її як коваріату та замість цього виконати ANCOVA (коваріаційний аналіз).

Це схоже на дисперсійний аналіз, за винятком того, що ми включаємо безперервну змінну (поточну оцінку студента) як коваріату , щоб ми могли зрозуміти, чи є різниця в середніх балах за іспит між трьома методами оцінки. навчання, навіть після врахування результатів студента. поточний рейтинг .

Коваріати в регресії

Коли ми виконуємо лінійну регресію, ми хочемо кількісно визначити зв’язок між однією або декількома пояснювальними змінними та змінною відповіді.

Наприклад, ми могли б виконати просту лінійну регресію , щоб кількісно визначити зв’язок між квадратними метрами та цінами на нерухомість у певному місті. Однак відомо, що вік будинку також є змінною величиною, яка впливає на ціну нерухомості.

Зокрема, старі будинки можуть бути пов’язані з нижчими цінами на нерухомість. У цьому випадку вік будинку буде коваріантом , оскільки ми насправді не зацікавлені в його вивченні, але ми знаємо, що він впливає на ціни на житло.

Отже, ми могли б включити вік будинку як пояснювальну змінну та запустити множинну лінійну регресію з квадратними метрами та віком будинку як пояснювальні змінні та ціну будинку як змінну відповіді.

Таким чином, коефіцієнт регресії для квадратних метрів скаже нам середню зміну ціни будинку, пов’язану зі збільшенням квадратних метрів на одиницю після врахування віку будинку .

Додаткові ресурси

Вступ до ANCOVA (дисперсійний аналіз)
Як інтерпретувати коефіцієнти регресії
Як виконати ANCOVA в Excel
Як виконати множинну лінійну регресію в Excel

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *