Hoe kwantielregressie uit te voeren in sas


Lineaire regressie is een methode die we kunnen gebruiken om de relatie tussen een of meer voorspellende variabelen en eenresponsvariabele te begrijpen.

Wanneer we lineaire regressie uitvoeren, willen we doorgaans de gemiddelde waarde van de responsvariabele schatten.

We zouden in plaats daarvan echter een methode kunnen gebruiken die bekend staat als kwantielregressie om elke percentielwaarde van de responswaarde te schatten, zoals het 30e percentiel, 90e percentiel, 98e percentiel, enz.

Om kwantielregressie in SAS uit te voeren, kunnen we de proc quantreg -instructie gebruiken.

In het volgende voorbeeld ziet u hoe u in de praktijk kwantielregressie in SAS kunt uitvoeren.

Voorbeeld: kwantielregressie uitvoeren in SAS

Stel dat we in SAS de volgende dataset hebben die het aantal gestudeerde uren en de bijbehorende examenscore voor studenten in een klas weergeeft:

 /*create dataset*/
data original_data;
    input hours score;
    datalines ;
1 75
1 79
2 78
2 83
2 85
3 84
3 84
3 89
4 93
4 88
4 79
4 94
5 96
5 98
;
run ;

/*view dataset*/
proc print data = original_data;

Vervolgens passen we een kwantielregressiemodel toe met bestudeerde uren als voorspellende variabele en examenscores als responsvariabele.

We zullen het model gebruiken om het verwachte 90e percentiel van examenscores te voorspellen op basis van het aantal bestudeerde uren:

 /*perform quantile regression*/
proc quantreg data =original_data;
    model score = hours / quantile = 0.9 ;
run ;

kwantielregressie in SAS

Uit het resultaat kunnen we de geschatte regressievergelijking zien:

Examenscore 90e percentiel = 76 + 4,5 (uren)

De 90e percentielscore van alle studenten die 2 uur studeren zou bijvoorbeeld 85 moeten zijn:

90e percentiel van examenscore = 76 + 4,5*(2) = 85 .

De uitvoer geeft ook een spreidingsdiagram van de onbewerkte gegevens weer, waarbij de passende regressielijn over de grafiek heen wordt gelegd:

In tegenstelling tot een traditioneel regressiemodel loopt de gepaste lijn in dit regressiemodel door het 90e percentiel van elke waarde van de voorspellende variabele in plaats van door de gemiddelde waarde.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:

Hoe eenvoudige lineaire regressie uit te voeren in R
Hoe meervoudige lineaire regressie uit te voeren in R
Hoe kwadratische regressie uit te voeren in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert