Excel: как интерпретировать значения p в выходных данных регрессии


Множественная линейная регрессия используется для количественной оценки взаимосвязи между двумя или более переменными-предикторами и переменной отклика .

Всякий раз, когда мы выполняем множественную линейную регрессию, нас всегда интересуют значения p в результате, чтобы определить, является ли связь между переменными-предикторами и переменной ответа статистически значимой.

В этом руководстве объясняется, как интерпретировать значения p в выходных данных модели множественной линейной регрессии в Excel.

Пример: интерпретация значений P в выводе регрессии в Excel

Предположим, мы хотим знать, влияет ли количество часов, потраченных на обучение, и количество сданных подготовительных экзаменов на оценку, которую студент получает на определенном вступительном экзамене в колледж.

Чтобы изучить эту взаимосвязь, мы можем выполнить множественную линейную регрессию, используя часы обучения и подготовительные экзамены, принимаемые в качестве предикторных переменных, а баллы на экзаменах — в качестве переменной ответа.

На следующем снимке экрана показаны результаты регрессии этой модели в Excel:

Вывод множественной линейной регрессии в Excel

В результате мы должны посмотреть на три значения p:

  • P-значение всей модели
  • Значение P первой переменной-предиктора (часы)
  • Значение P второй предикторной переменной (подготовительные экзамены)

Вот как интерпретировать каждое значение p:

P-значение всей модели

Значение p для всей модели можно найти в столбце с надписью F Значимость в результате.

Мы видим, что это значение p равно 0,00 .

Поскольку это значение меньше 0,05, можно сделать вывод, что регрессионная модель в целом статистически значима.

Другими словами, сочетание учебных часов и сданных подготовительных экзаменов имеет статистически значимую связь с итоговой оценкой экзамена.

Значение P первой переменной-предиктора (часы)

Значение p для первой переменной-предиктора, часов, равно 0,00.

Поскольку это значение меньше 0,05, можно сделать вывод, что изученные часы статистически значимы.

Другими словами, количество часов обучения студента статистически значимо связано с итоговой оценкой экзамена.

Значение P второй предикторной переменной (подготовительные экзамены)

Значение p для второй предикторной переменной — подготовительных экзаменов — составляет 0,52.

Поскольку это значение не менее 0,05, можно сделать вывод, что количество сданных подготовительных экзаменов не является статистически значимым.

Другими словами, количество сдаваемых студентом подготовительных экзаменов не имеет статистически значимой связи с оценкой, полученной на итоговом экзамене.

Поскольку эта переменная не является статистически значимой, мы можем принять решение удалить ее из модели, поскольку она не обеспечивает какого-либо существенного улучшения модели в целом.

В этом случае мы могли бы выполнить простую линейную регрессию, используя только изученные часы в качестве предикторной переменной.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в Excel:

Как выполнить простую линейную регрессию в Excel
Как выполнить множественную линейную регрессию в Excel
Как выполнить полиномиальную регрессию в Excel

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *