Excel: як інтерпретувати значення p у вихідних даних регресії
Множинна лінійна регресія використовується для кількісного визначення зв’язку між двома або більше змінними предикторами та змінною відповіді .
Кожного разу, коли ми виконуємо множинну лінійну регресію, нас завжди цікавлять p-значення в результаті, щоб визначити, чи зв’язок між змінними предиктора та змінною відповіді є статистично значущим.
У цьому підручнику пояснюється, як інтерпретувати p-значення у вихідних даних моделі множинної лінійної регресії в Excel.
Приклад: інтерпретація значень P у вихідних даних регресії в Excel
Припустімо, ми хочемо знати, чи впливає кількість годин, витрачених на навчання, і кількість складених підготовчих іспитів на оцінку, яку отримує студент на певному вступному іспиті до коледжу.
Щоб дослідити цей зв’язок, ми можемо виконати множинну лінійну регресію, використовуючи вивчені години та підготовчі іспити як прогностичні змінні та оцінки за іспит як змінну відповіді.
На наступному знімку екрана показано результат регресії цієї моделі в Excel:
Є три p-значення, на які ми повинні звернути увагу в результаті:
- P-значення загальної моделі
- P значення першої змінної предиктора (години)
- P значення другої предикторної змінної (підготовчі іспити)
Ось як інтерпретувати кожне значення p:
P-значення загальної моделі
P-значення для загальної моделі можна знайти в стовпці з позначкою F Значимість у результаті.
Ми бачимо, що це p-значення дорівнює 0,00 .
Оскільки це значення менше 0,05, можна зробити висновок, що регресійна модель в цілому є статистично значущою.
Іншими словами, комбінація вивчених годин і складених підготовчих іспитів має статистично значущий зв’язок із підсумковою оцінкою іспиту.
P значення першої змінної предиктора (години)
P-значення для першої змінної предиктора, години, становить 0,00.
Оскільки це значення менше 0,05, можна зробити висновок, що досліджувані години є статистично значущими.
Іншими словами, кількість годин, які навчається студент, має статистично значущий зв’язок з оцінкою підсумкового іспиту.
P значення другої предикторної змінної (підготовчі іспити)
P-значення для другої змінної предиктора, підготовчих іспитів, становить 0,52.
Оскільки це значення не менше 0,05, можна зробити висновок, що кількість складених підготовчих іспитів не є статистично значущою.
Іншими словами, кількість підготовчих іспитів, які складає студент, не має статистично значущого зв’язку з оцінкою, отриманою на випускному іспиті.
Оскільки ця змінна не є статистично значущою, ми можемо вирішити видалити її з моделі, оскільки вона не забезпечує жодного значного покращення загальної моделі.
У цьому випадку ми могли б виконати просту лінійну регресію, використовуючи лише досліджувані години як змінну предиктора.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в Excel:
Як виконати просту лінійну регресію в Excel
Як виконати множинну лінійну регресію в Excel
Як виконати поліноміальну регресію в Excel