Как посчитать r-квадрат вручную


В статистике R в квадрате (R 2 ) измеряет долю дисперсии переменной ответа , которую можно объяснить переменной-предиктором в регрессионной модели.

Для расчета R в квадрате мы используем следующую формулу:

R 2 = [ (nΣxy – (Σx)(Σy)) / (√ nΣx 2 — (Σx) 2 * √ nΣy 2 — (Σy) 2 ) ] 2

В следующем пошаговом примере показано, как вручную вычислить R-квадрат для заданной модели регрессии.

Шаг 1. Создайте набор данных

Сначала давайте создадим набор данных:

Шаг 2: Рассчитайте необходимые метрики

Далее давайте рассчитаем каждую метрику, которую нам нужно использовать в формуле R2 :

Шаг 3: Вычислите R-квадрат

Наконец, мы интегрируем каждую метрику в формулу для R 2 :

  • R 2 = [ (nΣxy – (Σx)(Σy)) / (√ nΣx 2 — (Σx) 2 * √ nΣy 2 — (Σy) 2 ) ] 2
  • R 2 = [ (8*(2169) – (72)(223)) / (√ 8*(818)-(72) 2 * √ 8*(6447)-(223) 2 ) ] 2
  • Я2 = 0,6686

Примечание. Число n в формуле представляет количество наблюдений в наборе данных и в этом примере оказывается n = 8 наблюдений.

Предполагая, что x — переменная-предиктор, а y — переменная отклика в этой регрессионной модели, R-квадрат модели равен 0,6686 .

Это говорит нам о том, что 66,86% изменений переменной y можно объяснить переменной x .

Дополнительные ресурсы

Введение в простую линейную регрессию
Введение в множественную линейную регрессию
R vs R-Square: в чем разница?
Что такое хорошее значение R-квадрата?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *