Як розрахувати vif в excel


Мультиколінеарність у регресійному аналізі виникає, коли дві або більше пояснювальних змінних сильно корельовані одна з одною, так що вони не надають унікальної чи незалежної інформації в регресійній моделі. Якщо ступінь кореляції між змінними досить високий, це може спричинити проблеми під час підгонки та інтерпретації регресійної моделі.

На щастя, можна виявити мультиколінеарність за допомогою метрики, що називається фактором інфляції дисперсії (VIF) , який вимірює кореляцію та силу кореляції між пояснювальними змінними в регресійній моделі.

Цей підручник пояснює, як обчислити VIF у Excel.

Приклад: розрахунок VIF в Excel

Для цього прикладу ми виконаємо множинну лінійну регресію, використовуючи наступний набір даних, який описує характеристики 10 баскетболістів. Ми підберемо регресійну модель, використовуючи рейтинг як змінну відповіді та очки, передачі та підбирання як пояснювальні змінні. Далі ми визначимо значення VIF для кожної пояснювальної змінної.

Необроблені дані в Excel

Крок 1: Виконайте множинну лінійну регресію.

На верхній стрічці перейдіть на вкладку «Дані» та натисніть «Аналіз даних». Якщо ви не бачите цей параметр, спершу потрібно інсталювати безкоштовне програмне забезпечення Analysis ToolPak .

Data Analysis Toolpak в Excel

Коли ви натиснете «Аналіз даних», з’явиться нове вікно. Виберіть «Регресія» та натисніть «ОК».

Регресія за допомогою Data Analysis Toolpak в Excel

Заповніть необхідні таблиці для змінних відповіді та пояснювальних змінних, а потім натисніть OK.

Множинна регресія в Excel

Це дає такий результат:

Вивід регресії в Excel

Крок 2: Обчисліть VIF для кожної пояснювальної змінної.

Далі ми можемо обчислити VIF для кожної з трьох пояснювальних змінних, виконуючи окремі регресії, використовуючи одну пояснювальну змінну як змінну відповіді, а дві інші – як пояснювальні змінні.

Наприклад, ми можемо розрахувати VIF для змінної балів , виконавши множинну лінійну регресію, використовуючи бали як змінну відповіді та результати передач і підбирань як пояснювальні змінні.

Це дає такий результат:

Розрахувати VIF в Excel

VIF для балів обчислюється як 1 / (1 – квадрат R) = 1 / (1 – 0,433099) = 1,76 .

Потім ми можемо повторити цей процес для двох інших змінних, передач і підбирань .

Виявляється, VIF для трьох пояснювальних змінних такі:

бали: 1,76
передачі: 1,96
підбирання: 1,18

Як інтерпретувати значення VIF

Значення VIF починається з 1 і не має верхньої межі. Загальне правило інтерпретації VIF:

  • Значення 1 вказує на відсутність кореляції між даною пояснювальною змінною та будь-якою іншою пояснювальною змінною в моделі.
  • Значення від 1 до 5 вказує на помірну кореляцію між даною пояснювальною змінною та іншими пояснювальними змінними в моделі, але часто вона недостатньо серйозна, щоб вимагати особливої уваги.
  • Значення більше 5 вказує на потенційно серйозну кореляцію між даною пояснювальною змінною та іншими пояснювальними змінними в моделі. У цьому випадку оцінки коефіцієнтів і p-значення в результатах регресії, ймовірно, ненадійні.

Оскільки кожне зі значень VIF пояснювальних змінних у нашій регресійній моделі закрите до 1, мультиколінеарність не є проблемою в нашому прикладі.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *