Как рассчитать доверительный интервал для наклона регрессии
Простая линейная регрессия используется для количественной оценки взаимосвязи между переменной-предиктором и переменной ответа.
Этот метод находит строку, которая лучше всего «соответствует» набору данных, и принимает следующую форму:
ŷ = б 0 + б 1 х
Золото:
- ŷ : Предполагаемое значение ответа.
- b 0 : Начало линии регрессии.
- b 1 : Наклон линии регрессии.
- x : значение прогнозируемой переменной.
Нас часто интересует значение b 1 , которое сообщает нам среднее изменение переменной отклика , связанное с увеличением на одну единицу предикторной переменной.
Мы можем использовать следующую формулу для расчета доверительного интервала для значения β 1 , значения наклона для всей совокупности:
Доверительный интервал для β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
Золото:
- b 1 = коэффициент наклона, указанный в таблице регрессии
- t 1-∝/2, n-2 = критическое значение t для уровня достоверности 1-∝ с n-2 степенями свободы, где n — общее количество наблюдений в нашем наборе данных.
- se(b 1 ) = стандартная ошибка b 1 , показанная в таблице регрессии.
В следующем примере показано, как на практике рассчитать доверительный интервал для наклона регрессии.
Пример: доверительный интервал для наклона регрессии.
Предположим, мы хотим подогнать простую модель линейной регрессии, используя часы обучения в качестве предикторной переменной и результаты экзаменов в качестве переменной ответа для 15 учеников в определенном классе:
Мы можем выполнить простую линейную регрессию в Excel и получить следующий результат:
Используя оценки коэффициентов в результате, мы можем записать подобранную простую модель линейной регрессии следующим образом:
Оценка = 65,334 + 1,982*(Часы обучения)
Значение наклона регрессии составляет 1,982 .
Это говорит нам о том, что каждый дополнительный час учебного времени связан со средним увеличением экзаменационной оценки на 1982 балла.
Мы можем использовать следующую формулу для расчета 95% доверительного интервала наклона:
- 95% ДИ для β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
- 95% ДИ для β 1 : 1,982 ± t 0,975, 15-2 * 0,248
- 95% ДИ для β 1 : 1,982 ± 2,1604 * 0,248
- 95% ДИ для β 1 : [1,446, 2,518]
95% доверительный интервал для наклона регрессии составляет [1,446, 2,518] .
Поскольку этот доверительный интервал не содержит значения 0, мы можем заключить, что существует статистически значимая связь между учебными часами и оценкой на экзамене.
Примечание . Мы использовали калькулятор обратного распределения t, чтобы найти критическое значение t, которое соответствует уровню достоверности 95% с 13 степенями свободы.
Дополнительные ресурсы
Следующие руководства предоставляют дополнительную информацию о линейной регрессии:
Введение в простую линейную регрессию
Введение в множественную линейную регрессию
Как читать и интерпретировать таблицу регрессии
Как сообщить о результатах регрессии