Как найти коэффициент корреляции по r2


Вы можете найти коэффициент корреляции между двумя переменными, извлекая квадратный корень из значения R в квадрате (R 2 ) простой модели линейной регрессии.

Коэффициент корреляции = √ R 2 простой модели линейной регрессии

Знак коэффициента наклона в модели регрессии показывает, является ли коэффициент корреляции положительным или отрицательным.

Следующие примеры показывают, как на практике найти коэффициент корреляции по значению R-квадрата регрессионной модели.

Примечание . Значение R-квадрата регрессионной модели также называется коэффициентом детерминации.

Пример 1: Нахождение коэффициента корреляции по R 2 (когда наклон положительный)

Предположим, мы подбираем простую модель линейной регрессии, используя часы обучения в качестве предикторной переменной и результаты экзаменов в качестве переменной ответа.

Предположим, мы получили следующий результат от модели:

Скорректированное уравнение регрессии : балл за экзамен = 65,55 + 2,78 (учебные часы)

R-квадрат (R 2 ) регрессионной модели : 0,7845.

Значение R-квадрата модели говорит нам, какой процент вариации результатов экзамена можно объяснить количеством учебных часов.

В этом примере мы видим, что количество изученных часов может объяснить 78,45% различий в результатах экзаменов.

Чтобы найти коэффициент корреляции между учебными часами и результатами экзамена, мы можем извлечь квадратный корень из R 2 :

Коэффициент корреляции = √ R 2 = √ 0,7845 = 0,8857

При положительном знаке для изучаемых часов в уравнении регрессии этот коэффициент корреляции является положительным.

Таким образом, коэффициент корреляции между учебными часами и баллом на экзамене составляет 0,8857 .

Пример 2: Нахождение коэффициента корреляции по R 2 (когда наклон отрицательный)

Предположим, мы подбираем простую модель линейной регрессии, используя возраст (в годах) в качестве предикторной переменной и максимальный жим лежа (в фунтах) в качестве переменной отклика.

Предположим, мы получили следующий результат от модели:

Скорректированное уравнение регрессии : максимальный жим лежа = 240,11 – 1,24 (возраст).

R в квадрате (R 2 ) регрессионной модели : 0,4773.

Значение R-квадрата модели говорит нам, какой процент вариаций максимального веса в жиме лежа можно объяснить возрастом.

В этом примере мы видим, что возраст может объяснить 47,73% изменений в максимальном объеме жима лежа.

Чтобы найти коэффициент корреляции между возрастом и максимальным жимом лежа, мы можем извлечь квадратный корень из R 2 :

Коэффициент корреляции = √ R 2 = √ 0,4773 = 0,6909

Поскольку знак возраста в уравнении регрессии отрицательный, этот коэффициент корреляции отрицательный.

Таким образом, коэффициент корреляции между возрастом и максимальным жимом лежа составляет -0,6909 .

Дополнительные ресурсы

Следующие учебные пособия предоставляют дополнительную информацию о коэффициентах корреляции:

Что считается «сильной» корреляцией?
Когда следует использовать корреляцию?
Как выполнить корреляционный t-тест

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *