Как рассчитать доверительный интервал для наклона регрессии


Простая линейная регрессия используется для количественной оценки взаимосвязи между переменной-предиктором и переменной ответа.

Этот метод находит строку, которая лучше всего «соответствует» набору данных, и принимает следующую форму:

ŷ = б 0 + б 1 х

Золото:

  • ŷ : Предполагаемое значение ответа.
  • b 0 : Начало линии регрессии.
  • b 1 : Наклон линии регрессии.
  • x : значение прогнозируемой переменной.

Нас часто интересует значение b 1 , которое сообщает нам среднее изменение переменной отклика , связанное с увеличением на одну единицу предикторной переменной.

Мы можем использовать следующую формулу для расчета доверительного интервала для значения β 1 , значения наклона для всей совокупности:

Доверительный интервал для β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )

Золото:

  •   b 1 = коэффициент наклона, указанный в таблице регрессии
  • t 1-∝/2, n-2 = критическое значение t для уровня достоверности 1-∝ с n-2 степенями свободы, где n — общее количество наблюдений в нашем наборе данных.
  • se(b 1 ) = стандартная ошибка b 1 , показанная в таблице регрессии.

В следующем примере показано, как на практике рассчитать доверительный интервал для наклона регрессии.

Пример: доверительный интервал для наклона регрессии.

Предположим, мы хотим подогнать простую модель линейной регрессии, используя часы обучения в качестве предикторной переменной и результаты экзаменов в качестве переменной ответа для 15 учеников в определенном классе:

Мы можем выполнить простую линейную регрессию в Excel и получить следующий результат:

Используя оценки коэффициентов в результате, мы можем записать подобранную простую модель линейной регрессии следующим образом:

Оценка = 65,334 + 1,982*(Часы обучения)

Значение наклона регрессии составляет 1,982 .

Это говорит нам о том, что каждый дополнительный час учебного времени связан со средним увеличением экзаменационной оценки на 1982 балла.

Мы можем использовать следующую формулу для расчета 95% доверительного интервала наклона:

  • 95% ДИ для β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
  • 95% ДИ для β 1 : 1,982 ± t 0,975, 15-2 * 0,248
  • 95% ДИ для β 1 : 1,982 ± 2,1604 * 0,248
  • 95% ДИ для β 1 : [1,446, 2,518]

95% доверительный интервал для наклона регрессии составляет [1,446, 2,518] .

Поскольку этот доверительный интервал не содержит значения 0, мы можем заключить, что существует статистически значимая связь между учебными часами и оценкой на экзамене.

Примечание . Мы использовали калькулятор обратного распределения t, чтобы найти критическое значение t, которое соответствует уровню достоверности 95% с 13 степенями свободы.

Дополнительные ресурсы

Следующие руководства предоставляют дополнительную информацию о линейной регрессии:

Введение в простую линейную регрессию
Введение в множественную линейную регрессию
Как читать и интерпретировать таблицу регрессии
Как сообщить о результатах регрессии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *