Що таке стандартна помилка оцінки? (визначення & #038; приклад)
Стандартна помилка оцінки – це спосіб вимірювання точності прогнозів, зроблених регресійною моделлю.
Часто позначається як σ est , воно обчислюється таким чином:
σ = √ Σ(y – ŷ) 2 /n
золото:
- y: спостережуване значення
- ŷ: прогнозоване значення
- n: Загальна кількість спостережень
Стандартна помилка оцінки дає нам уявлення про те, наскільки регресійна модель відповідає набору даних. Особливо:
- Чим менше значення, тим краще підходить.
- Чим більше значення, тим гірше підходить.
Для моделі регресії з невеликою стандартною помилкою оцінки точки даних будуть щільно згруповані навколо оцінюваної лінії регресії:
І навпаки, для регресійної моделі з великою стандартною помилкою оцінки точки даних будуть більш розкидані навколо лінії регресії:
У наведеному нижче прикладі показано, як обчислити та інтерпретувати стандартну помилку оцінки для моделі регресії в Excel.
Приклад: стандартна помилка оцінки в Excel
Виконайте наведені нижче дії, щоб обчислити стандартну помилку оцінки для регресійної моделі в Excel.
Крок 1: Введіть дані
Спочатку введіть значення набору даних:
Крок 2: Виконайте лінійну регресію
Потім клацніть вкладку Дані на верхній стрічці. Потім клацніть опцію «Аналіз даних» у групі «Аналіз» .
Якщо ви не бачите цю опцію, спочатку потрібно завантажити Analysis ToolPak .
У новому вікні, що з’явиться, клацніть «Регресія» , а потім — «ОК» .
У новому вікні, що з’явиться, введіть таку інформацію:
Після натискання кнопки OK з’явиться результат регресії:
Ми можемо використовувати коефіцієнти з таблиці регресії для побудови оцінюваного рівняння регресії:
ŷ = 13,367 + 1,693(x)
І ми бачимо, що стандартна помилка оцінки для цієї моделі регресії дорівнює 6,006 . Простими словами, це говорить нам, що середня точка даних знаходиться на відстані 6,006 одиниць від лінії регресії.
Ми можемо використовувати оцінене рівняння регресії та стандартну помилку оцінки, щоб побудувати 95% довірчий інтервал для прогнозованого значення певної точки даних.
Наприклад, припустимо, що x дорівнює 10. Використовуючи оцінене рівняння регресії, ми передбачимо, що y дорівнюватиме:
ŷ = 13,367 + 1,693*(10) = 30,297
І ми можемо отримати 95% довірчий інтервал для цієї оцінки за такою формулою:
- 95% ДІ = [ŷ – 1,96*σ є , ŷ + 1,96*σ є ]
Для нашого прикладу 95% довірчий інтервал буде розраховано як:
- 95% ДІ = [ŷ – 1,96*σ є , ŷ + 1,96*σ є ]
- 95% ДІ = [30,297 – 1,96*6,006, 30,297 + 1,96*6,006]
- 95% ДІ = [18 525, 42 069]
Додаткові ресурси
Як виконати просту лінійну регресію в Excel
Як виконати множинну лінійну регресію в Excel
Як створити діаграму залишку в Excel