Як розрахувати стандартизовані залишки в excel


Залишок — це різниця між спостережуваним значенням і прогнозованим значенням у регресійній моделі .

Він розраховується таким чином:

Залишок = спостережуване значення – прогнозоване значення

Якщо ми побудуємо спостережувані значення та накладемо підібрану лінію регресії, залишки для кожного спостереження будуть вертикальною відстанню між спостереженням і лінією регресії:

Приклад залишку в статистиці

Один тип залишку, який ми часто використовуємо для визначення викидів у регресійній моделі, називається стандартизованим залишком .

Він розраховується таким чином:

r i = e i / s(e i ) = e i / RSE√ 1-h ii

золото:

  • e i : i- й залишок
  • RSE: залишкова стандартна помилка моделі
  • h ii : Зростання i-го спостереження

На практиці ми часто розглядаємо будь-який стандартизований залишок, абсолютне значення якого перевищує 3, як викид.

Цей підручник містить покроковий приклад того, як обчислити стандартизовані залишки в Excel.

Крок 1: Введіть дані

Спочатку ми введемо значення з невеликого набору даних в Excel:

Крок 2: Обчисліть залишки

Далі ми перейдемо до вкладки «Дані» на верхній стрічці та клацнемо «Аналіз даних» у групі «Аналіз» :

Якщо ви ще не встановили цю надбудову, перегляньте цей посібник , щоб дізнатися, як це зробити. Його легко встановити та абсолютно безкоштовно.

Після того, як ви клацнете «Аналіз даних», виберіть опцію « Регресія» , а потім натисніть «ОК» . У новому вікні, що з’явиться, введіть наступну інформацію та натисніть OK :

Залишок для кожного спостереження з’явиться в результаті:

Залишки в Excel

Скопіюйте та вставте ці залишки в новий стовпець поруч із вихідними даними:

Крок 3: Розрахуйте кредитне плече

Далі нам потрібно розрахувати кредитне плече кожного спостереження.

На наступному зображенні показано, як це зробити:

Використання розрахунків у Excel для статистики

Ось формули, які використовуються в різних клітинках:

  • B14: =COUNT(B2:B13)
  • B15: = СЕРЕДНЄ (B2: B13)
  • B16: =DEVSQ(B2:B13)
  • E2: =1/$B$14+(B2-$B$15)^2/$B$16

Крок 4: Обчисліть стандартизовані залишки

Нарешті, ми можемо обчислити стандартизовані залишки за формулою:

r i = e i / RSE√ 1-h ii

CSR моделі можна знайти в результатах попередньої моделі. Виходить 4,44 :

Таким чином, ми можемо використовувати наступну формулу для розрахунку стандартизованого залишку для кожного спостереження:

Стандартизовані залишки в Excel

З результатів ми бачимо, що жоден із стандартизованих залишків не перевищує абсолютного значення 3. Таким чином, жодне зі спостережень не виглядає викидом.

Слід зазначити, що в деяких випадках дослідники вважають спостереження, стандартизовані залишки яких перевищують абсолютне значення 2, викидами.

Ви самі вирішуєте, чи використовувати абсолютне значення 2 чи 3 як порогове значення для викидів, залежно від конкретної проблеми, над якою ви працюєте.

Додаткові ресурси

Що таке залишки?
Що таке стандартизовані залишки?
Вступ до множинної лінійної регресії

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *