Как посчитать r-квадрат вручную
В статистике R в квадрате (R 2 ) измеряет долю дисперсии переменной ответа , которую можно объяснить переменной-предиктором в регрессионной модели.
Для расчета R в квадрате мы используем следующую формулу:
R 2 = [ (nΣxy – (Σx)(Σy)) / (√ nΣx 2 — (Σx) 2 * √ nΣy 2 — (Σy) 2 ) ] 2
В следующем пошаговом примере показано, как вручную вычислить R-квадрат для заданной модели регрессии.
Шаг 1. Создайте набор данных
Сначала давайте создадим набор данных:
Шаг 2: Рассчитайте необходимые метрики
Далее давайте рассчитаем каждую метрику, которую нам нужно использовать в формуле R2 :
Шаг 3: Вычислите R-квадрат
Наконец, мы интегрируем каждую метрику в формулу для R 2 :
- R 2 = [ (nΣxy – (Σx)(Σy)) / (√ nΣx 2 — (Σx) 2 * √ nΣy 2 — (Σy) 2 ) ] 2
- R 2 = [ (8*(2169) – (72)(223)) / (√ 8*(818)-(72) 2 * √ 8*(6447)-(223) 2 ) ] 2
- Я2 = 0,6686
Примечание. Число n в формуле представляет количество наблюдений в наборе данных и в этом примере оказывается n = 8 наблюдений.
Предполагая, что x — переменная-предиктор, а y — переменная отклика в этой регрессионной модели, R-квадрат модели равен 0,6686 .
Это говорит нам о том, что 66,86% изменений переменной y можно объяснить переменной x .
Дополнительные ресурсы
Введение в простую линейную регрессию
Введение в множественную линейную регрессию
R vs R-Square: в чем разница?
Что такое хорошее значение R-квадрата?