Jak obliczyć r-kwadrat w sas


R-kwadrat , często zapisywany jako r2 , jest miarą tego, jak dobrze model regresji liniowej pasuje do zbioru danych.

Wartość ta reprezentuje proporcję wariancjizmiennej odpowiedzi , którą można wyjaśnić za pomocą zmiennej predykcyjnej.

Wartość r 2 może wynosić od 0 do 1:

  • Wartość 0 wskazuje, że zmienna odpowiedzi nie może być w ogóle wyjaśniona przez zmienną predykcyjną.
  • Wartość 1 wskazuje, że zmienna odpowiedzi może być doskonale i bezbłędnie wyjaśniona przez zmienną predykcyjną.

Powiązane: Jaka jest dobra wartość R-kwadrat?

Poniższy przykład pokazuje krok po kroku, jak obliczyć wartość R-kwadrat dla prostego modelu regresji liniowej w SAS-ie.

Krok 1: Utwórz dane

Na potrzeby tego przykładu utworzymy zbiór danych zawierający całkowitą liczbę przepracowanych godzin i oceny z egzaminu końcowego 15 uczniów.

Dopasujemy prosty model regresji liniowej, wykorzystując godziny jako zmienną predykcyjną i wynik jako zmienną odpowiedzi.

Poniższy kod pokazuje, jak utworzyć ten zbiór danych w SAS-ie:

 /*create dataset*/
data exam_data;
    input hours score;
    datalines ;
1 64
2 66
4 76
5 73
5 74
6 81
6 83
7 82
8 80
10 88
11 84
11 82
12 91
12 93
14 89
;
run ;

/*view dataset*/
proc print data =exam_data;

Krok 2: Dopasuj prosty model regresji liniowej

Następnie użyjemy proc reg , aby dopasować prosty model regresji liniowej:

 /*fit simple linear regression model*/
proc reg data =exam_data;
    model score = hours;
run ; 

proste wyjście regresji liniowej w SAS-ie

Należy zauważyć, że wartość R-kwadrat na wyjściu wynosi 0,8310.

Oznacza to, że 83,1% różnic w wynikach egzaminów można wytłumaczyć liczbą godzin nauki.

Krok 3: Wyodrębnij wartość R-kwadrat z modelu regresji

Jeśli chcesz wyświetlić tylko wartość R-kwadrat tego modelu i żadnych innych wyników wyjściowych, możesz użyć następującego kodu:

 /*fit simple linear regression model*/
proc reg data =exam_data outest =outest noprint ;
    model score = hours / rsquare ;
run ;
quit ;

/*print R-squared value of model*/
proc print data =outest;
    var _RSQ_;
run ; 

Należy zauważyć, że na wyjściu wyświetlana jest tylko wartość R-kwadrat wynosząca 0,83098 .

Uwaga : Argument noprint w proc reg mówi SAS-owi, aby nie drukował całego wyniku regresji, tak jak to miało miejsce w poprzednim kroku.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak wykonać prostą regresję liniową w SAS-ie
Jak wykonać wielokrotną regresję liniową w SAS-ie
Jak wykonać regresję wielomianową w SAS-ie
Jak przeprowadzić regresję logistyczną w SAS-ie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *