Уравнение регрессии
В этой статье объясняется, что такое уравнение регрессии и для чего оно используется. Кроме того, вы узнаете, как найти уравнение регрессии, решить упражнение и, наконец, онлайн-калькулятор для расчета уравнения регрессии для любого набора данных.
Что такое уравнение регрессии?
Уравнение регрессии — это уравнение, которое лучше всего соответствует точечному графику, то есть уравнение регрессии является лучшим приближением набора данных.
Уравнение регрессии имеет форму y=β 0 +β 1 x, где β 0 — константа уравнения, а β 1 — наклон уравнения.
Если вы посмотрите на уравнение регрессии, это уравнение линии. Это означает, что связь между независимой переменной X и зависимой переменной Y моделируется как линейная зависимость, поскольку линия представляет линейную связь.
Итак, уравнение регрессии позволяет нам математически связать независимую переменную и зависимую переменную набора данных. Хотя уравнение регрессии, как правило, не способно точно определить значение каждого наблюдения, оно, тем не менее, используется для получения приблизительного значения его значения.

Как вы можете видеть на предыдущей диаграмме, уравнение регрессии помогает нам увидеть тенденцию набора данных и тип связи между независимой переменной и зависимой переменной.
Как рассчитать уравнение регрессии
Формулы расчета коэффициентов простого уравнения линейной регрессии следующие:
Золото:
-
– константа уравнения регрессии.
-
– наклон уравнения регрессии.
-
— значение независимой переменной X данных i.
-
— значение зависимой переменной Y данных i.
-
представляет собой среднее значение независимой переменной
-
представляет собой среднее значение зависимой переменной Y.
Пример расчета уравнения регрессии
- После сдачи статистического экзамена пятерым студентам был задан вопрос, сколько учебных часов они потратили на экзамен, данные приведены в таблице ниже. Рассчитайте уравнение регрессии на основе собранных статистических данных, чтобы линейно связать часы обучения с полученной оценкой. Далее определите, какую оценку получит ученик, проучившийся 8 часов.

Чтобы найти уравнение регрессии для выборочных данных, нам нужно определить коэффициенты b 0 и b 1 уравнения, и для этого нам нужно использовать формулы, представленные в разделе выше.
Однако, чтобы применить формулы уравнения линейной регрессии, мы должны сначала вычислить среднее значение независимой переменной и среднее значение зависимой переменной:
Теперь, когда мы знаем средние значения переменных, мы вычисляем коэффициент β 1 модели, используя соответствующую формулу:
Наконец, мы вычисляем коэффициент β 0 модели, используя соответствующую формулу:
Вкратце, уравнение линии линейной регрессии задачи выглядит следующим образом:
Ниже вы можете увидеть графическое представление выборочных данных вместе с простым уравнением модели линейной регрессии:

После того, как мы рассчитали уравнение регрессии, чтобы спрогнозировать оценку, которую получит студент, проучившийся 8 часов, просто подставьте это значение в полученное уравнение регрессии:
Таким образом, согласно проведенной модели линейной регрессии, если студент учился восемь часов, он получит на экзамене балл 5,56.
Калькулятор уравнения регрессии
Вставьте образец данных в калькулятор ниже, чтобы рассчитать уравнение регрессии. Вам необходимо разделить пары данных так, чтобы в первом поле были только значения независимой переменной X, а во втором поле — только значения зависимой переменной Y.
Данные должны быть разделены пробелом и введены с использованием точки в качестве десятичного разделителя.
Уравнение множественной линейной регрессии
Мы только что увидели, что такое простое уравнение линейной регрессии, однако модель регрессии также может представлять собой модель множественной линейной регрессии, которая включает две или более независимые переменные. Таким образом, множественная линейная регрессия позволяет линейно связать несколько объясняющих переменных с переменной отклика.
Уравнение модели множественной линейной регрессии :
Золото:
-
является зависимой переменной.
-
– независимая переменная i.
-
— константа уравнения множественной линейной регрессии.
-
коэффициент регрессии, связанный с переменной
.
-
— это ошибка или остаток, то есть разница между наблюдаемым значением и значением, оцененным моделью.
-
— общее количество переменных в модели.
Итак, если у нас есть образец с общим количеством
наблюдения, мы можем представить модель множественной линейной регрессии в матричной форме:
Приведенное выше матричное выражение можно переписать, присвоив каждой матрице букву:
Таким образом, применив критерий наименьших квадратов, мы можем прийти к формуле оценки коэффициентов уравнения множественной линейной регрессии :
Однако применение этой формулы очень трудоемко и требует много времени, поэтому на практике рекомендуется использовать компьютерное программное обеспечение (например, Minitab или Excel), позволяющее гораздо быстрее создать модель множественной регрессии.