Як створити залишковий контур вручну
Діаграма залишків – це тип графіка, який відображає значення змінної предиктора в регресійній моделі вздовж осі х і значення залишків вздовж осі у.
Цей графік використовується для оцінки того, чи є залишки регресійної моделі нормально розподіленими та чи демонструють вони гетероскедастичність .
У наступному покроковому прикладі показано, як вручну створити графік залишків для регресійної моделі.
Крок 1: Знайдіть прогнозовані значення
Припустімо, ми хочемо адаптувати регресійну модель до наступного набору даних:
Використовуючи статистичне програмне забезпечення (наприклад, Excel, R, Python, SPSS тощо), ми можемо побачити, що підібрана модель регресії така:
y = 10,4486 + 1,3037(x)
Потім ми можемо використовувати цю модель, щоб передбачити значення y на основі значення x. Наприклад, якщо x = 3, ми передбачаємо, що y буде:
y = 10,4486 + 1,3037(3) = 14,359
Ми можемо повторити цей процес для кожного спостереження в нашому наборі даних:
Крок 2: Знайдіть залишки
Залишок для даного спостереження в нашому наборі даних обчислюється таким чином:
Залишок = спостережене значення – прогнозоване значення
Наприклад, залишок першого спостереження буде розраховано таким чином:
Залишок = 15 – 14,359 = 0,641
Ми можемо повторити цей процес для кожного спостереження в нашому наборі даних:
Крок 3: Створіть ділянку залишків
Нарешті, ми можемо створити графік залишків, розмістивши значення x уздовж осі x і залишки уздовж осі y.
Наприклад, перша точка, яку ми розмістимо на нашому графіку, це (3, 0,641)
Наступна точка, яку ми розмістимо на нашому графіку, це (5, 0,033)
Ми продовжимо, поки не розмістимо всі 10 попарних комбінацій значень x і залишків на графіку:
Будь-яка точка вище нуля на графіку означає додатну нев’язку. Це означає, що спостережуване значення для y більше, ніж значення, передбачене регресійною моделлю.
Будь-яка точка, менша за нуль, означає від’ємну нев’язку. Це означає, що спостережуване значення для y є нижчим за значення, передбачене регресійною моделлю.
Оскільки точки на графіку випадково розкидані навколо залишку 0 без чіткої закономірності, це вказує на те, що зв’язок між x і y є лінійним і доцільно використовувати модель лінійної регресії.
І оскільки залишки систематично не збільшуються або зменшуються зі збільшенням змінної предиктора, це означає, що гетероскедастичність не є проблемою для цієї моделі регресії.
Додаткові ресурси
У наступних посібниках пояснюється, як створити графіки залишків за допомогою різного статистичного програмного забезпечення:
Як створити графік залишків на калькуляторі TI-84
Як створити діаграму залишку в Excel
Як створити ділянку залишків у R
Як створити залишковий графік у Python