Рівняння регресії

У цій статті пояснюється, що таке рівняння регресії та для чого воно використовується. Так само ви дізнаєтесь, як знайти рівняння регресії, розв’язану вправу та, нарешті, онлайн-калькулятор для розрахунку рівняння регресії для будь-якого набору даних.

Що таке рівняння регресії?

Рівняння регресії – це рівняння, яке найкраще відповідає точковому графіку, тобто рівняння регресії є найкращим наближенням набору даних.

Рівняння регресії має вигляд y=β 01 x, де β 0 є константою рівняння, а β 1 є кутом нахилу рівняння.

y=\beta_0+\beta_1x

Якщо ви подивитеся на рівняння регресії, це рівняння прямої. Це означає, що залежність між незалежною змінною X і залежною змінною Y моделюється як лінійна залежність, оскільки лінія представляє лінійну залежність.

Отже, рівняння регресії дозволяє нам математично пов’язати незалежну змінну та залежну змінну набору даних. Хоча рівняння регресії, як правило, не здатне точно визначити значення кожного спостереження, воно все ж використовується для отримання наближеного значення його значення.

рівняння регресії

Як ви бачите на попередній діаграмі, рівняння регресії допомагає нам побачити тенденцію набору даних і тип зв’язку між незалежною змінною та залежною змінною.

Як розрахувати рівняння регресії

Формули для розрахунку коефіцієнтів рівняння простої лінійної регресії такі:

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[12ex]\beta_0=\overline{y}-\beta_1\overline{x}\end{array}

золото:

  • \beta_0

    є константою рівняння регресії.

  • \beta_1

    є кутом рівняння регресії.

  • x_i

    є значенням незалежної змінної X даних i.

  • y_i

    є значенням залежної змінної Y даних i.

  • \overline{x}

    є середнім значенням незалежної змінної

  • \overline{y}

    є середнім значенням залежної змінної Y.

Приклад розрахунку рівняння регресії

  • Після іспиту зі статистики п’ятьох студентів запитали, скільки годин навчання вони витратили на іспит, дані наведені в таблиці нижче. Обчисліть рівняння регресії на основі зібраних статистичних даних, щоб лінійно зв’язати години навчання з отриманою оцінкою. Далі визначте, яку оцінку отримає учень, який навчався 8 годин.

Щоб знайти рівняння регресії для вибіркових даних, нам потрібно визначити коефіцієнти b 0 і b 1 рівняння, і для цього нам потрібно використати формули, наведені в розділі вище.

Однак, щоб застосувати формули для рівняння лінійної регресії, ми повинні спочатку обчислити середнє значення незалежної змінної та середнє значення залежної змінної:

\begin{array}{c}\overline{x}=\cfrac{11+5+10+12+7}{5}=9\\[4ex]\overline{y}=\cfrac{7+4+5+8+6}{5}=6\end{array}

Тепер, коли ми знаємо середні значення змінних, ми обчислюємо коефіцієнт β 1 моделі за допомогою відповідної формули:

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[10ex] \beta_1=\cfrac{\begin{array}{c}(11-9)(7-6)+(5-9)(4-6)+(10-9)(5-6)+\\+(12-9)(8-6)+(7-9)(6-6)\end{array}}{(11-9)^2+(5-9)^2+(10-9)^2+(12-9)^2+(7-9)^2}\\[6ex]\beta_1=0,4412\end{array}

Нарешті, розраховуємо коефіцієнт β 0 моделі за її відповідною формулою:

\begin{array}{l}\beta_0=\overline{y}-\beta_1\overline{x}\\[3ex]\beta_0=6-0,4412\cdot 9 \\[3ex]\beta_0=2,0294\end{array}

Коротше кажучи, рівняння лінії лінійної регресії задачі виглядає наступним чином:

y=2,0294+0,4412x

Нижче ви можете побачити графічне представлення вибіркових даних разом із простим рівнянням моделі лінійної регресії:

приклад лінії лінійної регресії

Коли ми розрахували рівняння регресії, щоб передбачити оцінку, яку отримає студент, який навчався 8 годин, просто підставте це значення в отримане рівняння регресії:

y=2,0294+0,4412\cdot 8=5,56

Таким чином, відповідно до проведеної лінійної регресійної моделі, якщо студент навчався вісім годин, він отримає на іспиті 5,56.

Калькулятор рівняння регресії

Підключіть зразки даних до калькулятора нижче, щоб обчислити своє рівняння регресії. Потрібно розділити пари даних так, щоб у першому полі були лише значення незалежної змінної X, а в другому – лише значення залежної змінної Y.

Дані повинні бути розділені пробілом і введені крапкою як десятковим роздільником.

  • Незалежна змінна

  • Залежна змінна Y:

Рівняння множинної лінійної регресії

Ми щойно побачили, що таке просте рівняння лінійної регресії, однак модель регресії також може бути моделлю множинної лінійної регресії, яка включає дві або більше незалежних змінних. Таким чином, множинна лінійна регресія дає можливість лінійно зв’язати кілька пояснювальних змінних зі змінною відповіді.

Рівняння моделі множинної лінійної регресії виглядає так:

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

золото:

  • y

    є залежною змінною.

  • x_i

    є незалежною змінною i.

  • \beta_0

    є константою рівняння множинної лінійної регресії.

  • \beta_i

    це коефіцієнт регресії, пов’язаний зі змінною

    x_i

    .

  • \bm{\varepsilon}

    є помилкою або залишком, тобто різницею між спостережуваним значенням і значенням, оціненим за допомогою моделі.

  • m

    загальна кількість змінних у моделі.

Отже, якщо у нас є вибірка із загальною кількістю

n

спостережень, ми можемо представити модель множинної лінійної регресії у матричній формі:

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

Наведений вище матричний вираз можна переписати, присвоївши літеру кожній матриці:

Y=X\beta+\varepsilon

Таким чином, застосовуючи критерій найменших квадратів, ми можемо отримати формулу для оцінки коефіцієнтів рівняння множинної лінійної регресії :

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

Однак застосування цієї формули є дуже трудомістким і трудомістким, тому на практиці рекомендується використовувати комп’ютерне програмне забезпечення (наприклад, Minitab або Excel), яке дозволяє набагато швидше створити модель множинної регресії.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *