Jak znaleźć współczynnik korelacji z r2


Współczynnik korelacji między dwiema zmiennymi można znaleźć, biorąc pierwiastek kwadratowy z wartości R do kwadratu (R 2 ) z prostego modelu regresji liniowej.

Współczynnik korelacji = √ R 2 prostego modelu regresji liniowej

Znak współczynnika nachylenia w modelu regresji informuje, czy współczynnik korelacji jest dodatni czy ujemny.

Poniższe przykłady pokazują, jak w praktyce znaleźć współczynnik korelacji na podstawie wartości R kwadratu modelu regresji.

Uwaga : Wartość R-kwadrat modelu regresji nazywana jest także współczynnikiem determinacji.

Przykład 1: Znajdowanie współczynnika korelacji na podstawie R 2 (gdy nachylenie jest dodatnie)

Załóżmy, że dopasowujemy prosty model regresji liniowej, wykorzystując przestudiowane godziny jako zmienną predykcyjną i wyniki egzaminów jako zmienną odpowiedzi.

Załóżmy, że otrzymamy następujące dane wyjściowe z modelu:

Skorygowane równanie regresji : wynik egzaminu = 65,55 + 2,78 (godziny nauki)

R-kwadrat ( R2 ) modelu regresji : 0,7845

Wartość R-kwadrat modelu mówi nam, jaki procent zmienności wyników egzaminów można wyjaśnić liczbą godzin nauki.

W tym przykładzie widzimy, że przestudiowane godziny są w stanie wyjaśnić 78,45% różnic w wynikach egzaminów.

Aby znaleźć współczynnik korelacji między przestudiowanymi godzinami a wynikami egzaminów, możemy wziąć pierwiastek kwadratowy z R 2 :

Współczynnik korelacji = √ R 2 = √ 0,7845 = 0,8857

Znak jest dodatni dla godzin badanych w równaniu regresji, współczynnik korelacji jest dodatni.

Zatem współczynnik korelacji między przestudiowanymi godzinami a wynikiem egzaminu wynosi 0,8857 .

Przykład 2: Znajdowanie współczynnika korelacji na podstawie R 2 (gdy nachylenie jest ujemne)

Załóżmy, że dopasowujemy prosty model regresji liniowej, wykorzystując wiek (w latach) jako zmienną predykcyjną i maksymalne wyciskanie na ławce (w funtach) jako zmienną odpowiedzi.

Załóżmy, że otrzymamy następujące dane wyjściowe z modelu:

Skorygowane równanie regresji : maksymalne wyciskanie na ławce = 240,11 – 1,24 (wiek)

Rkwadrat ( R2 ) modelu regresji : 0,4773

Wartość R-kwadrat modelu mówi nam, jaki procent zmienności szczytowych funtów w wyciskaniu na ławce można wytłumaczyć wiekiem.

W tym przykładzie widzimy, że wiek jest w stanie wyjaśnić 47,73% zmienności maksymalnej ilości wyciskania na ławce.

Aby znaleźć współczynnik korelacji między wiekiem a maksymalnym wyciskaniem na ławce, możemy wziąć pierwiastek kwadratowy z R 2 :

Współczynnik korelacji = √ R 2 = √ 0,4773 = 0,6909

Ponieważ znak wieku w równaniu regresji jest ujemny, współczynnik korelacji jest ujemny.

Zatem współczynnik korelacji między wiekiem a maksymalnym wyciskaniem na ławce wynosi -0,6909 .

Dodatkowe zasoby

Poniższe samouczki zawierają dodatkowe informacje na temat współczynników korelacji:

Co uważa się za „silną” korelację?
Kiedy warto zastosować korelację?
Jak wykonać test t korelacji

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *