Jak obliczyć r-kwadrat w sas
R-kwadrat , często zapisywany jako r2 , jest miarą tego, jak dobrze model regresji liniowej pasuje do zbioru danych.
Wartość ta reprezentuje proporcję wariancjizmiennej odpowiedzi , którą można wyjaśnić za pomocą zmiennej predykcyjnej.
Wartość r 2 może wynosić od 0 do 1:
- Wartość 0 wskazuje, że zmienna odpowiedzi nie może być w ogóle wyjaśniona przez zmienną predykcyjną.
- Wartość 1 wskazuje, że zmienna odpowiedzi może być doskonale i bezbłędnie wyjaśniona przez zmienną predykcyjną.
Powiązane: Jaka jest dobra wartość R-kwadrat?
Poniższy przykład pokazuje krok po kroku, jak obliczyć wartość R-kwadrat dla prostego modelu regresji liniowej w SAS-ie.
Krok 1: Utwórz dane
Na potrzeby tego przykładu utworzymy zbiór danych zawierający całkowitą liczbę przepracowanych godzin i oceny z egzaminu końcowego 15 uczniów.
Dopasujemy prosty model regresji liniowej, wykorzystując godziny jako zmienną predykcyjną i wynik jako zmienną odpowiedzi.
Poniższy kod pokazuje, jak utworzyć ten zbiór danych w SAS-ie:
/*create dataset*/ data exam_data; input hours score; datalines ; 1 64 2 66 4 76 5 73 5 74 6 81 6 83 7 82 8 80 10 88 11 84 11 82 12 91 12 93 14 89 ; run ; /*view dataset*/ proc print data =exam_data;
Krok 2: Dopasuj prosty model regresji liniowej
Następnie użyjemy proc reg , aby dopasować prosty model regresji liniowej:
/*fit simple linear regression model*/ proc reg data =exam_data; model score = hours; run ;
Należy zauważyć, że wartość R-kwadrat na wyjściu wynosi 0,8310.
Oznacza to, że 83,1% różnic w wynikach egzaminów można wytłumaczyć liczbą godzin nauki.
Krok 3: Wyodrębnij wartość R-kwadrat z modelu regresji
Jeśli chcesz wyświetlić tylko wartość R-kwadrat tego modelu i żadnych innych wyników wyjściowych, możesz użyć następującego kodu:
/*fit simple linear regression model*/ proc reg data =exam_data outest =outest noprint ; model score = hours / rsquare ; run ; quit ; /*print R-squared value of model*/ proc print data =outest; var _RSQ_; run ;
Należy zauważyć, że na wyjściu wyświetlana jest tylko wartość R-kwadrat wynosząca 0,83098 .
Uwaga : Argument noprint w proc reg mówi SAS-owi, aby nie drukował całego wyniku regresji, tak jak to miało miejsce w poprzednim kroku.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:
Jak wykonać prostą regresję liniową w SAS-ie
Jak wykonać wielokrotną regresję liniową w SAS-ie
Jak wykonać regresję wielomianową w SAS-ie
Jak przeprowadzić regresję logistyczną w SAS-ie