Jak wykonać regresję kwantylową w sas


Regresja liniowa to metoda, którą możemy wykorzystać do zrozumienia związku między jedną lub większą liczbą zmiennych predykcyjnych azmienną odpowiedzi .

Zwykle, gdy przeprowadzamy regresję liniową, chcemy oszacować średnią wartość zmiennej odpowiedzi.

Zamiast tego moglibyśmy jednak zastosować metodę znaną jako regresja kwantylowa , aby oszacować dowolną wartość percentylową wartości odpowiedzi, na przykład 30. percentyl, 90. percentyl, 98. percentyl itp.

Aby przeprowadzić regresję kwantylową w SAS, możemy użyć instrukcji proc quantreg .

Poniższy przykład pokazuje, jak w praktyce przeprowadzić regresję kwantylową w SAS-ie.

Przykład: uruchamianie regresji kwantylowej w SAS-ie

Załóżmy, że mamy następujący zbiór danych w SAS-ie, który pokazuje liczbę przepracowanych godzin i odpowiadający im wynik egzaminu dla uczniów w klasie:

 /*create dataset*/
data original_data;
    input hours score;
    datalines ;
1 75
1 79
2 78
2 83
2 85
3 84
3 84
3 89
4 93
4 88
4 79
4 94
5 96
5 98
;
run ;

/*view dataset*/
proc print data = original_data;

Następnie dopasujemy model regresji kwantylowej, wykorzystując przestudiowane godziny jako zmienną predykcyjną i wyniki egzaminów jako zmienną odpowiedzi.

Wykorzystamy ten model do przewidzenia oczekiwanego 90. percentyla wyników egzaminu na podstawie liczby przepracowanych godzin:

 /*perform quantile regression*/
proc quantreg data =original_data;
    model score = hours / quantile = 0.9 ;
run ;

regresja kwantylowa w SAS

Z wyniku możemy zobaczyć oszacowane równanie regresji:

Wynik egzaminu na 90. percentylu = 76 + 4,5 (godziny)

Na przykład 90. percentyl wyniku wszystkich uczniów, którzy uczą się 2 godziny, powinien wynosić 85:

90. percentyl wyniku egzaminu = 76 + 4,5*(2) = 85 .

Dane wyjściowe wyświetlają również wykres rozrzutu surowych danych z dopasowaną linią regresji nałożoną na wykres:

W przeciwieństwie do tradycyjnego modelu regresji, dopasowana linia w tym modelu regresji przechodzi przez 90. percentyl każdej wartości zmiennej predykcyjnej zamiast wartości średniej.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak wykonać prostą regresję liniową w R
Jak wykonać wielokrotną regresję liniową w R
Jak wykonać regresję kwadratową w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *