Как найти коэффициент корреляции по r2
Вы можете найти коэффициент корреляции между двумя переменными, извлекая квадратный корень из значения R в квадрате (R 2 ) простой модели линейной регрессии.
Коэффициент корреляции = √ R 2 простой модели линейной регрессии
Знак коэффициента наклона в модели регрессии показывает, является ли коэффициент корреляции положительным или отрицательным.
Следующие примеры показывают, как на практике найти коэффициент корреляции по значению R-квадрата регрессионной модели.
Примечание . Значение R-квадрата регрессионной модели также называется коэффициентом детерминации.
Пример 1: Нахождение коэффициента корреляции по R 2 (когда наклон положительный)
Предположим, мы подбираем простую модель линейной регрессии, используя часы обучения в качестве предикторной переменной и результаты экзаменов в качестве переменной ответа.
Предположим, мы получили следующий результат от модели:
Скорректированное уравнение регрессии : балл за экзамен = 65,55 + 2,78 (учебные часы)
R-квадрат (R 2 ) регрессионной модели : 0,7845.
Значение R-квадрата модели говорит нам, какой процент вариации результатов экзамена можно объяснить количеством учебных часов.
В этом примере мы видим, что количество изученных часов может объяснить 78,45% различий в результатах экзаменов.
Чтобы найти коэффициент корреляции между учебными часами и результатами экзамена, мы можем извлечь квадратный корень из R 2 :
Коэффициент корреляции = √ R 2 = √ 0,7845 = 0,8857
При положительном знаке для изучаемых часов в уравнении регрессии этот коэффициент корреляции является положительным.
Таким образом, коэффициент корреляции между учебными часами и баллом на экзамене составляет 0,8857 .
Пример 2: Нахождение коэффициента корреляции по R 2 (когда наклон отрицательный)
Предположим, мы подбираем простую модель линейной регрессии, используя возраст (в годах) в качестве предикторной переменной и максимальный жим лежа (в фунтах) в качестве переменной отклика.
Предположим, мы получили следующий результат от модели:
Скорректированное уравнение регрессии : максимальный жим лежа = 240,11 – 1,24 (возраст).
R в квадрате (R 2 ) регрессионной модели : 0,4773.
Значение R-квадрата модели говорит нам, какой процент вариаций максимального веса в жиме лежа можно объяснить возрастом.
В этом примере мы видим, что возраст может объяснить 47,73% изменений в максимальном объеме жима лежа.
Чтобы найти коэффициент корреляции между возрастом и максимальным жимом лежа, мы можем извлечь квадратный корень из R 2 :
Коэффициент корреляции = √ R 2 = √ 0,4773 = 0,6909
Поскольку знак возраста в уравнении регрессии отрицательный, этот коэффициент корреляции отрицательный.
Таким образом, коэффициент корреляции между возрастом и максимальным жимом лежа составляет -0,6909 .
Дополнительные ресурсы
Следующие учебные пособия предоставляют дополнительную информацию о коэффициентах корреляции:
Что считается «сильной» корреляцией?
Когда следует использовать корреляцию?
Как выполнить корреляционный t-тест