Як виконати частковий тест f в excel


Частковий F-тест використовується, щоб визначити, чи є статистично значуща різниця між моделлю регресії та вкладеною версією тієї самої моделі.

Вкладена модель — це просто модель, яка містить підмножину змінних предикторів у загальній моделі регресії.

Наприклад, припустімо, що ми маємо таку модель регресії з чотирма змінними предикторів:

Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε

Прикладом вкладеної моделі може бути наступна модель лише з двома початковими змінними предиктора:

Y = β 0 + β 1 x 1 + β 2 x 2 + ε

Щоб визначити, чи істотно відрізняються ці дві моделі, ми можемо виконати частковий F-тест, який обчислює наступну статистику F-тесту:

F = (( Скорочений RSS – Повний RSS)/p) / ( Повний RSS /nk)

золото:

  • Скорочений RSS : Залишкова сума квадратів зменшеної (тобто «вкладеної») моделі.
  • RSS full : Залишкова сума квадратів повної моделі.
  • p: кількість предикторів, видалених із повної моделі.
  • n: загальна кількість спостережень у наборі даних.
  • k: кількість коефіцієнтів (включаючи відрізок) у повній моделі.

Цей тест використовує такі нульові та альтернативні гіпотези :

H 0 : усі коефіцієнти, видалені з повної моделі, дорівнюють нулю.

H A : принаймні один із коефіцієнтів, вилучених із повної моделі, відмінний від нуля.

Якщо p-значення , що відповідає статистиці F-критерію, нижче певного рівня значущості (наприклад, 0,05), тоді ми можемо відхилити нульову гіпотезу та зробити висновок, що принаймні один із коефіцієнтів, вилучених із повної моделі, є значущим.

У наступному прикладі показано, як виконати частковий F-тест у Excel.

Приклад: частковий тест F в Excel

Припустимо, що в Excel є такий набір даних:

Припустімо, ми хочемо визначити, чи є різниця між наступними двома моделями регресії:

Повна модель: y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4

Скорочена модель: y = β 0 + β 1 x 1 + β 2 x 2

Ми можемо виконати множинну лінійну регресію в Excel для кожної моделі, щоб отримати такий результат:

Потім ми можемо використати наступну формулу для обчислення статистики F-тесту для часткового F-тесту:

Статистика тесту виявляється 2,064 .

Потім ми можемо використати наступну формулу для обчислення відповідного значення p:

P-значення виявляється рівним 0,1974 .

Оскільки це p-значення не менше 0,05, ми не зможемо відхилити нульову гіпотезу. Це означає, що ми не маємо достатньо доказів, щоб стверджувати, що будь-яка із змінних предикторів x3 або x4 є статистично значущою.

Іншими словами, додавання x3 і x4 до регресійної моделі не покращує суттєво відповідність моделі.

Додаткові ресурси

Як виконати просту лінійну регресію в Excel
Як виконати множинну лінійну регресію в Excel
Як обчислити стандартну помилку регресії в Excel

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *