Як розрахувати vif в excel
Мультиколінеарність у регресійному аналізі виникає, коли дві або більше пояснювальних змінних сильно корельовані одна з одною, так що вони не надають унікальної чи незалежної інформації в регресійній моделі. Якщо ступінь кореляції між змінними досить високий, це може спричинити проблеми під час підгонки та інтерпретації регресійної моделі.
На щастя, можна виявити мультиколінеарність за допомогою метрики, що називається фактором інфляції дисперсії (VIF) , який вимірює кореляцію та силу кореляції між пояснювальними змінними в регресійній моделі.
Цей підручник пояснює, як обчислити VIF у Excel.
Приклад: розрахунок VIF в Excel
Для цього прикладу ми виконаємо множинну лінійну регресію, використовуючи наступний набір даних, який описує характеристики 10 баскетболістів. Ми підберемо регресійну модель, використовуючи рейтинг як змінну відповіді та очки, передачі та підбирання як пояснювальні змінні. Далі ми визначимо значення VIF для кожної пояснювальної змінної.
Крок 1: Виконайте множинну лінійну регресію.
На верхній стрічці перейдіть на вкладку «Дані» та натисніть «Аналіз даних». Якщо ви не бачите цей параметр, спершу потрібно інсталювати безкоштовне програмне забезпечення Analysis ToolPak .
Коли ви натиснете «Аналіз даних», з’явиться нове вікно. Виберіть «Регресія» та натисніть «ОК».
Заповніть необхідні таблиці для змінних відповіді та пояснювальних змінних, а потім натисніть OK.
Це дає такий результат:
Крок 2: Обчисліть VIF для кожної пояснювальної змінної.
Далі ми можемо обчислити VIF для кожної з трьох пояснювальних змінних, виконуючи окремі регресії, використовуючи одну пояснювальну змінну як змінну відповіді, а дві інші – як пояснювальні змінні.
Наприклад, ми можемо розрахувати VIF для змінної балів , виконавши множинну лінійну регресію, використовуючи бали як змінну відповіді та результати передач і підбирань як пояснювальні змінні.
Це дає такий результат:
VIF для балів обчислюється як 1 / (1 – квадрат R) = 1 / (1 – 0,433099) = 1,76 .
Потім ми можемо повторити цей процес для двох інших змінних, передач і підбирань .
Виявляється, VIF для трьох пояснювальних змінних такі:
бали: 1,76
передачі: 1,96
підбирання: 1,18
Як інтерпретувати значення VIF
Значення VIF починається з 1 і не має верхньої межі. Загальне правило інтерпретації VIF:
- Значення 1 вказує на відсутність кореляції між даною пояснювальною змінною та будь-якою іншою пояснювальною змінною в моделі.
- Значення від 1 до 5 вказує на помірну кореляцію між даною пояснювальною змінною та іншими пояснювальними змінними в моделі, але часто вона недостатньо серйозна, щоб вимагати особливої уваги.
- Значення більше 5 вказує на потенційно серйозну кореляцію між даною пояснювальною змінною та іншими пояснювальними змінними в моделі. У цьому випадку оцінки коефіцієнтів і p-значення в результатах регресії, ймовірно, ненадійні.
Оскільки кожне зі значень VIF пояснювальних змінних у нашій регресійній моделі закрите до 1, мультиколінеарність не є проблемою в нашому прикладі.