Что такое график остатков/кредитного плеча? (определение & #038; пример)
График зависимости остатков от кредитного плеча — это тип диагностической диаграммы , которая позволяет нам выявить влиятельные наблюдения в регрессионной модели.
Вот как этот тип графика выглядит на языке статистического программирования R:
Каждое наблюдение в наборе данных отображается как отдельная точка на графике. Ось X показывает кредитное плечо каждой точки, а ось Y показывает стандартизированный остаток каждой точки.
Под рычагом понимается степень, в которой коэффициенты регрессионной модели изменятся, если конкретное наблюдение будет удалено из набора данных.
Наблюдения с высоким рычагом оказывают сильное влияние на коэффициенты регрессионной модели. Если мы удалим эти наблюдения, коэффициенты модели существенно изменятся.
Стандартизованные остатки относятся к стандартизированной разнице между прогнозируемым значением наблюдения и фактическим значением наблюдения.
Следует отметить, что наблюдение может иметь высокое абсолютное значение для стандартизированного остатка, но низкое значение для кредитного плеча.
Как интерпретировать график зависимости остатков от кредитного плеча
Если точка на этом графике выходит за пределы расстояния Кука (красные пунктирные линии), то это наблюдение считается влиятельным.
Давайте обратимся к графику зависимости остатков от кредитного плеча, показанному ранее:
В приведенном выше примере мы видим, что наблюдение № 10 ближе всего к пределу расстояния Кука, но не выходит за пределы пунктирной линии. Это означает , что в нашей регрессионной модели нет влиятельных точек .
Однако предположим, что у нас есть следующий график остатка/кредитного плеча:
Мы видим, что наблюдение №1 в правом верхнем углу находится за пределами красных пунктирных линий. Это указывает на то, что это точка влияния .
Это означает, что если мы удалим это наблюдение из нашего набора данных и снова подберем регрессионную модель, коэффициенты модели значительно изменятся.
Как обращаться с влиятельными наблюдениями
Если вы создаете график зависимости остатков от кредитного плеча для модели и видите, что одно или несколько наблюдений определены как влиятельные, вы можете сделать несколько вещей:
1. Убедитесь, что наблюдение не является ошибкой.
Прежде чем предпринимать какие-либо действия, вам следует сначала убедиться, что влиятельные наблюдения не являются результатом ошибки ввода данных или другого странного события.
2. Попробуйте подобрать другую модель регрессии.
Влиятельные наблюдения могут указывать на то, что указанная вами модель плохо соответствует данным. В этом случае вы можете попробовать модель полиномиальной регрессии или нелинейную модель.
3. Удалите влиятельные комментарии.
Наконец, вы можете решить просто удалить влиятельные наблюдения, если указанная вами модель хорошо соответствует данным, за исключением одного или двух влиятельных наблюдений.
Дополнительные ресурсы
В следующих руководствах представлена дополнительная информация о том, как использовать остатки для оценки соответствия регрессионных моделей.
Что такое остатки в статистике?
Что такое стандартизированные остатки?
Как интерпретировать диагностические графики в R