Как рассчитать скорректированный r-квадрат в excel
R-квадрат , часто обозначаемый R2 , представляет собой долю дисперсии переменной отклика , которую можно объяснить переменными-предикторами в модели линейной регрессии .
Значение R в квадрате может варьироваться от 0 до 1. Значение 0 указывает, что переменная ответа вообще не может быть объяснена переменной-предиктором, а значение 1 указывает, что переменная ответа может быть объяснена переменной-предиктором. прекрасно объяснено без ошибок предсказателем. переменные.
Скорректированный R-квадрат — это модифицированная версия R-квадрата, которая корректирует количество предикторов в регрессионной модели. Он рассчитывается следующим образом:
Скорректированный R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]
Золото:
- R 2 : R 2 модели.
- n : Количество наблюдений
- k : Количество переменных-предсказателей
Поскольку R2 всегда увеличивается по мере добавления предикторов в модель, скорректированный R2 может служить метрикой, показывающей, насколько полезна модель, скорректированной на основе количества предикторов в модели .
В этом руководстве представлен пошаговый пример расчета скорректированного R2 для регрессионной модели в R.
Шаг 1. Создайте данные
В этом примере мы создадим набор данных, содержащий следующие переменные для 12 разных студентов:
- Результаты экзамена
- Часы, потраченные на учебу
- Текущий класс
Шаг 2. Подберите регрессионную модель
Далее мы подберем модель множественной линейной регрессии , используя оценку на экзамене в качестве переменной ответа , а часы обучения и текущую оценку в качестве предикторных переменных.
Чтобы соответствовать этой модели, щелкните вкладку «Данные» на верхней ленте, затем нажмите «Анализ данных »:
Если эта опция недоступна, необходимо сначала загрузить Data Analysis ToolPak .
В появившемся окне выберите Регрессия . В появившемся новом окне укажите следующую информацию:
Как только вы нажмете «ОК» , появятся выходные данные регрессионной модели:
Шаг 3. Интерпретируйте скорректированный R-квадрат.
Скорректированный R-квадрат регрессионной модели — это число, следующее за скорректированным R-квадратом :
Скорректированный R-квадрат для этой модели оказывается равным 0,946019 .
Это значение чрезвычайно велико, что указывает на то, что предикторные переменные «Часы обучения» и «Текущая оценка» хорошо справляются с прогнозированием результатов экзамена .
Дополнительные ресурсы
Что такое хорошее значение R-квадрата?
Как рассчитать скорректированный R-квадрат в R
Как рассчитать скорректированный R-квадрат в Python