Как выполнить частичный f-тест в excel


Частичный F-тест используется, чтобы определить, существует ли статистически значимая разница между регрессионной моделью и вложенной версией той же модели.

Вложенная модель — это просто модель, которая содержит подмножество переменных-предикторов в общей модели регрессии.

Например, предположим, что у нас есть следующая модель регрессии с четырьмя переменными-предикторами:

Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε

Примером вложенной модели может быть следующая модель только с двумя исходными переменными-предикторами:

Y = β 0 + β 1 x 1 + β 2 x 2 + ε

Чтобы определить, существенно ли отличаются эти две модели, мы можем выполнить частичный F-тест, который вычисляет следующую статистику F-теста:

F = (( Уменьшенный RSS – Полный RSS)/p) / ( Полный RSS /nk)

Золото:

  • Уменьшенный RSS : Остаточная сумма квадратов уменьшенной (т.е. «вложенной») модели.
  • RSS полный : Остаточная сумма квадратов полной модели.
  • p: количество предикторов, удаленных из полной модели.
  • n: общее количество наблюдений в наборе данных.
  • k: количество коэффициентов (включая точку пересечения) в полной модели.

В этом тесте используются следующие нулевые и альтернативные гипотезы :

H 0 : Все коэффициенты, удаленные из полной модели, равны нулю.

H A : По крайней мере один из коэффициентов, удаленных из полной модели, не равен нулю.

Если значение p, соответствующее статистике F-теста, ниже определенного уровня значимости (например, 0,05), то мы можем отвергнуть нулевую гипотезу и сделать вывод, что по крайней мере один из коэффициентов, удаленных из полной модели, является значимым.

В следующем примере показано, как выполнить частичный F-тест в Excel.

Пример: частичный F-тест в Excel

Предположим, у нас есть следующий набор данных в Excel:

Предположим, мы хотим определить, есть ли разница между следующими двумя регрессионными моделями:

Полная модель: y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4.

Сокращенная модель: y = β 0 + β 1 x 1 + β 2 x 2

Мы можем выполнить множественную линейную регрессию в Excel для каждой модели, чтобы получить следующий результат:

Затем мы можем использовать следующую формулу для расчета статистики F-теста для частичного F-теста:

Статистика теста оказывается 2,064 .

Затем мы можем использовать следующую формулу для расчета соответствующего значения p:

Значение p оказывается равным 0,1974 .

Поскольку это значение p не меньше 0,05, мы не сможем отвергнуть нулевую гипотезу. Это означает, что у нас недостаточно доказательств, чтобы сказать, что какая-либо из переменных-предикторов x3 или x4 является статистически значимой.

Другими словами, добавление x3 и x4 к регрессионной модели существенно не улучшает соответствие модели.

Дополнительные ресурсы

Как выполнить простую линейную регрессию в Excel
Как выполнить множественную линейную регрессию в Excel
Как рассчитать стандартную ошибку регрессии в Excel

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *