Excel: як використовувати linest для виконання множинної лінійної регресії


Ви можете використовувати функцію ЛІНІЙНИЙ в Excel, щоб адаптувати модель множинної лінійної регресії до набору даних.

Ця функція використовує такий базовий синтаксис:

 = LINEST ( known_y's, [known_x's], [const], [stats] )

золото:

  • відомі_y : масив відомих значень y
  • відомі_x : масив відомих значень x
  • const : необов’язковий аргумент. Якщо TRUE, константа b обробляється нормально. Якщо значення FALSE, константа b має значення 1.
  • stats : необов’язковий аргумент. Якщо TRUE, повертається додаткова статистика регресії. Якщо FALSE, додаткова регресійна статистика не повертається.

Наступний покроковий приклад показує, як використовувати цю функцію на практиці.

Крок 1: Введіть дані

Спочатку давайте введемо такий набір даних в Excel:

Крок 2. Використовуйте LINEST, щоб підібрати модель множинної лінійної регресії

Припустімо, що ми хочемо підібрати модель множинної лінійної регресії, використовуючи x1 , x2 і x3 як змінні-прогнози та y як змінну відповіді.

Для цього ми можемо ввести таку формулу в будь-яку клітинку, щоб відповідати цій моделі множинної лінійної регресії

 =LINEST( D2:D14 , A2:C14 )

На наступному знімку екрана показано, як використовувати цю формулу на практиці:

Множинна лінійна регресія Excel LINEST

Ось як інтерпретувати результат:

  • Коефіцієнт перетину дорівнює 28,5986 .
  • Коефіцієнт для x1 становить 0,34271 .
  • Коефіцієнт для x2 становить -3,00393 .
  • Коефіцієнт для x3 становить 0,849687 .

Використовуючи ці коефіцієнти, ми можемо записати підігнане рівняння регресії наступним чином:

y = 28,5986 + 0,34271(x1) – 3,00393(x2) + 0,849687(x3)

Крок 3 (необов’язково): перегляд додаткової статистики регресії

Ми також можемо встановити значення аргументу stats у функції LINEST рівним TRUE , щоб відобразити додаткову регресійну статистику для підігнаного рівняння регресії:

Зібране рівняння регресії залишається незмінним:

y = 28,5986 + 0,34271(x1) – 3,00393(x2) + 0,849687(x3)

Ось як інтерпретувати інші значення результату:

  • Стандартна помилка для x3 становить 0,453295 .
  • Стандартна помилка для x2 становить 1,626423 .
  • Стандартна помилка для x1 становить 1,327566 .
  • Стандартна помилка для перехоплення становить 13,20088 .
  • R 2 моделі становить .838007 .
  • Залишкова стандартна помилка для y становить 3,707539 .
  • Загальна статистика F становить 15,51925 .
  • Ступенів свободи дорівнює 9 .
  • Сума квадратів регресії дорівнює 639,9797 .
  • Залишкова сума квадратів дорівнює 123,7126 .

Загалом, мірою, що представляє найбільший інтерес у цій додатковій статистиці, є значення R 2 , яке представляє частку дисперсії у змінній відповіді, яку можна пояснити змінною предиктора.

Значення R 2 може змінюватися від 0 до 1.

Оскільки R 2 цієї конкретної моделі дорівнює 0,838 , це говорить нам про те, що змінні предикторів добре справляються з прогнозуванням значення змінної відповіді y.

За темою: що таке хороше значення R-квадрат?

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в Excel:

Як використовувати функцію LOGEST в Excel
Як виконати нелінійну регресію в Excel
Як виконати кубічну регресію в Excel

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *