Що таке діаграма залишків/кредитного плеча? (визначення & #038; приклад)


Діаграма залишків і кредитного плеча – це тип діагностичної діаграми , яка дозволяє нам ідентифікувати впливові спостереження в регресійній моделі.

Ось як цей тип графіка виглядає в мові статистичного програмування R:

Кожне спостереження в наборі даних відображається як одна точка на графіку. На осі абсцис відкладено кредитне плече кожної точки, а на осі у – стандартизований залишок кожної точки.

Леверидж стосується ступеня, до якого коефіцієнти регресійної моделі змінилися б, якщо конкретне спостереження було вилучено з набору даних.

Спостереження з високим левериджем сильно впливають на коефіцієнти регресійної моделі. Якщо ми приберемо ці спостереження, коефіцієнти моделі суттєво зміниться.

Стандартизовані залишки стосуються стандартизованої різниці між прогнозованим значенням для спостереження та фактичним значенням спостереження.

Слід зазначити, що спостереження може мати високе абсолютне значення для стандартизованого залишку, але низьке значення для кредитного плеча.

Як інтерпретувати графік залишків і кредитного плеча

Якщо точка на цьому графіку виходить за межі відстані Кука (червоні пунктирні лінії), то це вважається впливовим спостереженням.

Давайте звернемося до графіка залишків і кредитного плеча, показаного раніше:

У наведеному вище прикладі ми бачимо, що спостереження №10 є найближчим до межі відстані Кука, але воно не виходить за межі пунктирної лінії. Це означає , що в нашій моделі регресії немає впливових точок .

Однак припустімо, що ми маємо наступний графік залишку/кредитного плеча:

Ми бачимо, що спостереження №1 у верхньому правому куті знаходиться за межами червоних пунктирних ліній. Це означає, що це точка впливу .

Це означає, що якби ми вилучили це спостереження з нашого набору даних і знову підігнали регресійну модель, коефіцієнти моделі суттєво змінилися б.

Як поводитися з впливовими спостереженнями

Якщо ви створюєте графік залежності залишків від кредитного плеча для моделі та бачите, що одне або кілька спостережень визначено як впливові, ви можете зробити кілька речей:

1. Переконайтеся, що спостереження не є помилкою.

Перш ніж вживати будь-яких дій, ви повинні спочатку переконатися, що впливові спостереження не є результатом помилки введення даних або іншої дивної події.

2. Спробуйте підібрати іншу модель регресії.

Впливові спостереження можуть свідчити про те, що вказана вами модель погано відповідає даним. У цьому випадку ви можете спробувати модель поліноміальної регресії або нелінійну модель.

3. Видаліть впливові коментарі.

Нарешті, ви можете вирішити просто видалити впливові спостереження, якщо вказана вами модель добре відповідає даним, за винятком одного чи двох впливових спостережень.

Додаткові ресурси

Наступні навчальні посібники надають додаткову інформацію про те, як використовувати залишки для оцінки відповідності регресійних моделей.

Що таке залишки в статистиці?
Що таке стандартизовані залишки?
Як інтерпретувати діагностичні графіки в R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *