Як розрахувати скоригований r-квадрат у excel


R-квадрат , часто записуваний як R2 , — це частка дисперсії у змінній відповіді , яку можна пояснити змінними предикторами в моделі лінійної регресії .

Значення R у квадраті може коливатися від 0 до 1. Значення 0 вказує на те, що змінна відповіді взагалі не може бути пояснена змінною предиктором, тоді як значення 1 вказує на те, що змінна відповіді може бути пояснена змінною предиктора. ідеально пояснюється без помилок провісником. змінні.

Скоригований R-квадрат – це модифікована версія R-квадрату, яка коригує кількість предикторів у регресійній моделі. Він розраховується таким чином:

Скоригований R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]

золото:

  • R 2 : R 2 моделі
  • n : кількість спостережень
  • k : кількість змінних предиктора

Оскільки R2 завжди збільшується, коли ви додаєте предиктори до моделі, скоригований R2 може служити показником, який повідомляє вам, наскільки корисною є модель, скоригована на основі кількості предикторів у моделі .

Цей підручник надає покроковий приклад того, як обчислити скоригований R2 для моделі регресії в R.

Крок 1: Створіть дані

Для цього прикладу ми створимо набір даних, що містить такі змінні для 12 різних студентів:

  • Результат іспиту
  • Години, витрачені на навчання
  • Поточний клас

Крок 2. Підберіть регресійну модель

Далі ми підберемо модель множинної лінійної регресії , використовуючи оцінку за іспит як змінну відповіді , а навчальні години та поточну оцінку як змінні-прогнози.

Щоб відповідати цій моделі, клацніть вкладку «Дані» на верхній стрічці, а потім клацніть «Аналіз даних» :

Якщо цей параметр недоступний, спочатку потрібно завантажити Data Analysis ToolPak .

У вікні, що з’явиться, виберіть Регресія . У новому вікні, що з’явиться, введіть таку інформацію:

Після натискання кнопки OK з’явиться вихід регресійної моделі:

Крок 3: Інтерпретуйте скоригований R-квадрат

Скоригований R-квадрат регресійної моделі є числом поруч зі скоригованим R-квадратом :

Скоригований R-квадрат в Excel

Скоригований R-квадрат для цієї моделі виявляється рівним 0,946019 .

Це значення надзвичайно високе, що вказує на те, що змінні предиктора «Години навчання» та «Поточна оцінка» добре справляються з прогнозуванням оцінки за іспит .

Додаткові ресурси

Що таке хороше значення R-квадрат?
Як обчислити скоригований R-квадрат у R
Як розрахувати скоригований R-квадрат у Python

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *