Як обчислити довірчий інтервал для відрізка регресії
Проста лінійна регресія використовується для кількісного визначення зв’язку між змінною предиктором і змінною відповіді.
Цей метод знаходить рядок, який найкраще «відповідає» набору даних і має такий вигляд:
ŷ = b 0 + b 1 x
золото:
- ŷ : оцінене значення відповіді
- b 0 : Початок лінії регресії
- b 1 : Нахил лінії регресії
- x : значення передбачуваної змінної
Нас часто цікавить значення b 1 , яке говорить нам про середню зміну змінної відповіді , пов’язану зі збільшенням на одну одиницю змінної предиктора.
Однак у рідкісних випадках нас також цікавить значення b0 , яке повідомляє нам про середнє значення змінної відповіді, коли змінна предиктора дорівнює нулю.
Ми можемо використати наступну формулу для розрахунку довірчого інтервалу для значення β 0 , справжньої постійної сукупності:
Довірчий інтервал для β 0 : b 0 ± t α/2, n-2 * se(b 0 )
У наступному прикладі показано, як обчислити довірчий інтервал для перехоплення на практиці.
Приклад: довірчий інтервал для відрізка регресії
Припустімо, ми хочемо підібрати просту модель лінійної регресії, використовуючи вивчені години як змінну прогностику та оцінки іспитів як змінну відповіді для 15 студентів у певному класі:

У наведеному нижче коді показано, як підігнати цю просту модель лінійної регресії в R:
#create data frame df <- data. frame (hours=c(1, 2, 4, 5, 5, 6, 6, 7, 8, 10, 11, 11, 12, 12, 14), score=c(64, 66, 76, 73, 74, 81, 83, 82, 80, 88, 84, 82, 91, 93, 89)) #fit simple linear regression model fit <- lm(score ~ hours, data=df) #view summary of model summary(fit) Call: lm(formula = score ~ hours, data = df) Residuals: Min 1Q Median 3Q Max -5,140 -3,219 -1,193 2,816 5,772 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 65,334 2,106 31,023 1.41e-13 *** hours 1.982 0.248 7.995 2.25e-06 *** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.641 on 13 degrees of freedom Multiple R-squared: 0.831, Adjusted R-squared: 0.818 F-statistic: 63.91 on 1 and 13 DF, p-value: 2.253e-06
Використовуючи оцінки коефіцієнтів у результаті, ми можемо записати підігнану просту модель лінійної регресії наступним чином:
Оцінка = 65,334 + 1,982*(вивчені години)
Значення перетину становить 65,334. Це говорить нам про те, що орієнтовний середній бал іспиту для студента, який навчається нуль годин, становить 65 334 .
Ми можемо використати таку формулу, щоб обчислити 95% довірчий інтервал для перехоплення:
- 95% ДІ для β 0 : b 0 ± t α/2, n-2 * se(b 0 )
- 95% ДІ для β 0 : 65,334 ± t 0,05/2,15-2 * 2,106
- 95% ДІ для β 0 : 65,334 ± 2,1604 * 2,106
- 95% ДІ для β 0 : [60,78, 69,88]
Ми інтерпретуємо це так, що ми на 95% впевнені, що фактичний середній бал студентів, які навчаються протягом нуля годин, становить від 60,78 до 69,88.
Примітка . Ми використали калькулятор оберненого t-розподілу, щоб знайти критичне значення t, яке відповідає 95% рівню довіри з 13 ступенями свободи.
Застереження щодо розрахунку довірчого інтервалу для відрізка регресії
На практиці ми часто не обчислюємо довірчий інтервал для відрізка регресії, оскільки зазвичай немає сенсу інтерпретувати значення відрізка в моделі регресії.
Наприклад, припустімо, що ми використовуємо регресійну модель, яка використовує зріст баскетболіста як змінну прогнозу та середнє значення очок за гру як змінну відповіді.
Неможливо, щоб гравець мав зріст нуль футів, тому не має сенсу інтерпретувати перехоплення буквально в цій моделі.
Існує незліченна кількість подібних сценаріїв, у яких змінна-прогноз не може приймати нульове значення. Тому немає сенсу інтерпретувати початкове значення моделі або створювати довірчий інтервал для походження.
Наприклад, розглянемо наступні потенційні змінні прогнозу в моделі:
- Площа будинку
- Довжина автомобіля
- Вага людини
Кожна з цих змінних предикторів не може приймати нульове значення. Тому не має сенсу розраховувати довірчий інтервал для походження регресійної моделі за будь-якої з цих обставин.
Додаткові ресурси
У наступних посібниках надається додаткова інформація про лінійну регресію.
Вступ до простої лінійної регресії
Вступ до множинної лінійної регресії
Як читати та інтерпретувати таблицю регресії
Як повідомити про результати регресії