Jak wykonać regresję kwantylową w sas
Regresja liniowa to metoda, którą możemy wykorzystać do zrozumienia związku między jedną lub większą liczbą zmiennych predykcyjnych azmienną odpowiedzi .
Zwykle, gdy przeprowadzamy regresję liniową, chcemy oszacować średnią wartość zmiennej odpowiedzi.
Zamiast tego moglibyśmy jednak zastosować metodę znaną jako regresja kwantylowa , aby oszacować dowolną wartość percentylową wartości odpowiedzi, na przykład 30. percentyl, 90. percentyl, 98. percentyl itp.
Aby przeprowadzić regresję kwantylową w SAS, możemy użyć instrukcji proc quantreg .
Poniższy przykład pokazuje, jak w praktyce przeprowadzić regresję kwantylową w SAS-ie.
Przykład: uruchamianie regresji kwantylowej w SAS-ie
Załóżmy, że mamy następujący zbiór danych w SAS-ie, który pokazuje liczbę przepracowanych godzin i odpowiadający im wynik egzaminu dla uczniów w klasie:
/*create dataset*/
data original_data;
input hours score;
datalines ;
1 75
1 79
2 78
2 83
2 85
3 84
3 84
3 89
4 93
4 88
4 79
4 94
5 96
5 98
;
run ;
/*view dataset*/
proc print data = original_data;
Następnie dopasujemy model regresji kwantylowej, wykorzystując przestudiowane godziny jako zmienną predykcyjną i wyniki egzaminów jako zmienną odpowiedzi.
Wykorzystamy ten model do przewidzenia oczekiwanego 90. percentyla wyników egzaminu na podstawie liczby przepracowanych godzin:
/*perform quantile regression*/ proc quantreg data =original_data; model score = hours / quantile = 0.9 ; run ;
Z wyniku możemy zobaczyć oszacowane równanie regresji:
Wynik egzaminu na 90. percentylu = 76 + 4,5 (godziny)
Na przykład 90. percentyl wyniku wszystkich uczniów, którzy uczą się 2 godziny, powinien wynosić 85:
90. percentyl wyniku egzaminu = 76 + 4,5*(2) = 85 .
Dane wyjściowe wyświetlają również wykres rozrzutu surowych danych z dopasowaną linią regresji nałożoną na wykres:
W przeciwieństwie do tradycyjnego modelu regresji, dopasowana linia w tym modelu regresji przechodzi przez 90. percentyl każdej wartości zmiennej predykcyjnej zamiast wartości średniej.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:
Jak wykonać prostą regresję liniową w R
Jak wykonać wielokrotną regresję liniową w R
Jak wykonać regresję kwadratową w R