Як створювати та інтерпретувати графіки qq у stata
Діаграма QQ , скорочення від «квантиль-квантиль», часто використовується для оцінки того, чи залишки регресійного аналізу розподілені нормально чи ні.
Цей підручник пояснює, як створити та інтерпретувати діаграму QQ у Stata.
Приклад: графік QQ у Stata
Для цього прикладу ми використаємо автоматичний набір даних, вбудований у Stata. Ми підберемо модель множинної лінійної регресії, використовуючи милі на галлон і об’єм як пояснювальні змінні, а ціну – як змінну відповіді. Потім ми отримаємо залишки для моделі та створимо графік QQ, щоб побачити, чи залишки відповідають нормальному розподілу.
Крок 1: Завантажте та відобразіть дані.
Спочатку ми завантажимо дані за допомогою такої команди:
автоматичне використання системи
Далі ми отримаємо короткий підсумок даних за допомогою такої команди:
узагальнити
Крок 2. Підберіть регресійну модель.
Далі ми використаємо таку команду, щоб підібрати регресійну модель:
регресія ціна миль на галон об’єм
Крок 3: Обчисліть залишки .
Пам’ятайте, що залишок – це просто різниця між прогнозованим значенням відповіді (розрахованим за оціночним рівнянням регресії) і фактичним значенням відповіді.
Ми можемо отримати залишки кожного прогнозу, використовуючи команду residuals і зберігаючи ці значення в змінній з будь-яким ім’ям. У цьому випадку ми будемо використовувати назву resid_price :
передбачити residency_price, залишки
Крок 4: Створіть графік QQ.
Тепер, коли у нас є список залишків, ми можемо створити графік QQ за допомогою команди qnorm :
qnorm price_resid
Крок 5: Інтерпретуйте графік QQ.
Ідея графіка QQ проста: якщо залишки йдуть приблизно по прямій лінії під кутом 45 градусів, то залишки розподіляються приблизно нормально. Ми бачимо на нашому графіку QQ вище, що залишки, як правило, трохи відхиляються від лінії 45 градусів, особливо на кінцях, що може вказувати на те, що вони не є нормальним розподілом.
Хоча графік QQ не є офіційним статистичним тестом, він надає простий спосіб візуально перевірити, чи розподілені залишки нормально чи ні.
Якщо виявиться, що ваші залишки значно відхиляються від лінії 45 градусів на графіку QQ, ви можете розглянути можливість виконання перетворення змінної відповіді у вашій регресії, наприклад, використовуючи квадратний корінь або логарифм змінної відповіді.
Якщо залишки відхиляються лише незначно, вам не потрібно турбуватися про перетворення змінної відповіді, оскільки регресія досить стійка до відхилень від нормального.