Excel: рассчитать доверительный интервал для коэффициента регрессии


В модели линейной регрессии коэффициент регрессии сообщает нам среднее изменение переменной ответа , связанное с увеличением на одну единицу переменной-предиктора.

Мы можем использовать следующую формулу для расчета доверительного интервала для коэффициента регрессии:

Доверительный интервал для β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )

Золото:

  •   b 1 = коэффициент регрессии, указанный в таблице регрессии.
  • t 1-∝/2, n-2 = критическое значение t для уровня достоверности 1-∝ с n-2 степенями свободы, где n — общее количество наблюдений в нашем наборе данных.
  • se(b 1 ) = стандартная ошибка b 1 , показанная в таблице регрессии.

В следующем примере показано, как рассчитать доверительный интервал для коэффициента регрессии в Excel.

Пример: доверительный интервал для коэффициента регрессии в Excel

Предположим, мы хотим подогнать простую модель линейной регрессии, используя часы обучения в качестве предикторной переменной и результаты экзаменов в качестве переменной ответа для 15 учеников в определенном классе:

Мы можем ввести следующую формулу в ячейку D2, чтобы выполнить простую линейную регрессию, используя значения в столбце « Часы» в качестве переменной-предиктора, а значения в столбце « Оценка» в качестве переменной ответа:

 =LINEST( B2:B16 , A2:A16 , TRUE, TRUE)

Обратите внимание, что первый аргумент TRUE сообщает Excel, что нужно вычислить отрезок уравнения регрессии в обычном режиме, не принуждая его равняться нулю.

Второй аргумент TRUE указывает Excel, что в дополнение к коэффициентам необходимо создать дополнительную статистику регрессии.

На следующем снимке экрана показан результат этой формулы (мы объясняем, что представляет собой каждое выходное значение, в красном тексте под выходными данными):

Используя коэффициенты регрессии, мы можем записать подобранное уравнение регрессии следующим образом:

Оценка = 65,334 + 1,982*(Часы обучения)

Обратите внимание, что коэффициент регрессии для часов равен 1,982 .

Это говорит нам о том, что каждый дополнительный час учебного времени связан со средним увеличением экзаменационной оценки на 1982 балла.

Чтобы рассчитать 95% доверительный интервал для коэффициента регрессии, мы можем ввести следующие формулы в ячейки H2 и H3:

  • H2: = D2 – T.ОБР.2T(0,05, E5)*D3
  • H3: = D2 + T.ОБР.2T(0,05, E5)*D3

На следующем снимке экрана показано, как использовать эти формулы на практике:

доверительный интервал для коэффициента регрессии в Excel

95% доверительный интервал для коэффициента регрессии составляет [1,446, 2,518] .

Поскольку этот доверительный интервал не содержит значения 0 , мы можем заключить, что существует статистически значимая связь между учебными часами и оценкой на экзамене.

Мы также можем подтвердить, что это правильно, вручную рассчитав 95% доверительный интервал для коэффициента регрессии:

  • 95% ДИ для β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
  • 95% ДИ для β 1 : 1,982 ± t 0,975, 15-2 * 0,248
  • 95% ДИ для β 1 : 1,982 ± 2,1604 * 0,248
  • 95% ДИ для β 1 : [1,446, 2,518]

95% доверительный интервал для коэффициента регрессии составляет [1,446, 2,518] .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в Excel:

Как выполнить простую линейную регрессию в Excel
Как выполнить множественную линейную регрессию в Excel
Как интерпретировать значения P в выходных данных регрессии в Excel

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *