Excel: як використовувати linest для виконання множинної лінійної регресії

за Редакція 16 Липня, 2023 Гід 0 коментарів

Ви можете використовувати функцію ЛІНІЙНИЙ в Excel, щоб адаптувати модель множинної лінійної регресії до набору даних.

Ця функція використовує такий базовий синтаксис:

 = LINEST ( known_y's, [known_x's], [const], [stats] )

золото:

відомі_y : масив відомих значень y
відомі_x : масив відомих значень x
const : необов’язковий аргумент. Якщо TRUE, константа b обробляється нормально. Якщо значення FALSE, константа b має значення 1.
stats : необов’язковий аргумент. Якщо TRUE, повертається додаткова статистика регресії. Якщо FALSE, додаткова регресійна статистика не повертається.

Наступний покроковий приклад показує, як використовувати цю функцію на практиці.

Крок 1: Введіть дані

Спочатку давайте введемо такий набір даних в Excel:

Крок 2. Використовуйте LINEST, щоб підібрати модель множинної лінійної регресії

Припустімо, що ми хочемо підібрати модель множинної лінійної регресії, використовуючи x1 , x2 і x3 як змінні-прогнози та y як змінну відповіді.

Для цього ми можемо ввести таку формулу в будь-яку клітинку, щоб відповідати цій моделі множинної лінійної регресії

 =LINEST( D2:D14 , A2:C14 )

На наступному знімку екрана показано, як використовувати цю формулу на практиці:

Множинна лінійна регресія Excel LINEST

Ось як інтерпретувати результат:

Коефіцієнт перетину дорівнює 28,5986 .
Коефіцієнт для x1 становить 0,34271 .
Коефіцієнт для x2 становить -3,00393 .
Коефіцієнт для x3 становить 0,849687 .

Використовуючи ці коефіцієнти, ми можемо записати підігнане рівняння регресії наступним чином:

y = 28,5986 + 0,34271(x1) – 3,00393(x2) + 0,849687(x3)

Крок 3 (необов’язково): перегляд додаткової статистики регресії

Ми також можемо встановити значення аргументу stats у функції LINEST рівним TRUE , щоб відобразити додаткову регресійну статистику для підігнаного рівняння регресії:

Зібране рівняння регресії залишається незмінним:

y = 28,5986 + 0,34271(x1) – 3,00393(x2) + 0,849687(x3)

Ось як інтерпретувати інші значення результату:

Стандартна помилка для x3 становить 0,453295 .
Стандартна помилка для x2 становить 1,626423 .
Стандартна помилка для x1 становить 1,327566 .
Стандартна помилка для перехоплення становить 13,20088 .
R ² моделі становить .838007 .
Залишкова стандартна помилка для y становить 3,707539 .
Загальна статистика F становить 15,51925 .
Ступенів свободи дорівнює 9 .
Сума квадратів регресії дорівнює 639,9797 .
Залишкова сума квадратів дорівнює 123,7126 .

Загалом, мірою, що представляє найбільший інтерес у цій додатковій статистиці, є значення R ² , яке представляє частку дисперсії у змінній відповіді, яку можна пояснити змінною предиктора.

Значення R ² може змінюватися від 0 до 1.

Оскільки R ² цієї конкретної моделі дорівнює 0,838 , це говорить нам про те, що змінні предикторів добре справляються з прогнозуванням значення змінної відповіді y.

За темою: що таке хороше значення R-квадрат?

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в Excel:

Як використовувати функцію LOGEST в Excel
Як виконати нелінійну регресію в Excel
Як виконати кубічну регресію в Excel

Про автора

Редакція

Привіт, я Бенджамін, професор статистики на пенсії, який став викладачем статистики. Маючи великий досвід і знання в галузі статистики, я готовий поділитися своїми знаннями, щоб розширити можливості студентів через Statorials. Дізнайтеся більше