Как посчитать r-квадрат в google таблицах
R-квадрат , часто обозначаемый как r2 , является мерой того, насколько хорошо модель линейной регрессии соответствует набору данных.
Говоря техническим языком, это доля дисперсии переменной отклика, которую можно объяснить с помощью предикторной переменной.
Значение r 2 может находиться в диапазоне от 0 до 1:
- Значение 0 указывает, что переменная ответа вообще не может быть объяснена переменной-предиктором.
- Значение 1 указывает на то, что переменная ответа может быть полностью без ошибок объяснена переменной-предиктором.
В следующем примере показано, как вычислить R в квадрате для двух переменных в Google Sheets.
Пример: расчет R-квадрата в Google Sheets
Предположим, у нас есть следующие данные о количестве учебных часов и результатах экзаменов, полученных для 20 студентов:
Теперь предположим, что мы хотим подогнать простую модель линейной регрессии , используя «часы» в качестве предикторной переменной и «оценку» в качестве переменной отклика.
Чтобы найти R-квадрат этой модели, мы можем использовать функцию Google Sheets RSQ() , которая использует следующий синтаксис:
=RSQ(известный_ys, известный_xs)
Золото:
- known_ys: значения переменной ответа
- известные_xs: значения переменной-предиктора
В нашем примере мы можем ввести следующую формулу в ячейку D2:
=RSQ( A2:A21 , B2:B21 )
На следующем снимке экрана показано, как использовать эту формулу на практике:
Значение R-квадрата оказывается около 0,7273 .
Это означает, что 72,73% различий в результатах экзаменов можно объяснить количеством изученных часов.
Связанный: Что такое хорошее значение R-квадрата?
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в Google Таблицах:
Как найти наиболее подходящую строку в Google Таблицах
Как выполнить линейную регрессию в Google Sheets
Как создать прогноз в Google Таблицах (с примером)