Come eseguire la regressione quantile in sas


La regressione lineare è un metodo che possiamo utilizzare per comprendere la relazione tra una o più variabili predittive e una variabile di risposta .

In genere, quando eseguiamo una regressione lineare, vogliamo stimare il valore medio della variabile di risposta.

Tuttavia, potremmo invece utilizzare un metodo noto come regressione quantile per stimare qualsiasi valore percentile del valore di risposta, come il 30° percentile, il 90° percentile, il 98° percentile, ecc.

Per eseguire la regressione quantile in SAS, possiamo utilizzare l’istruzione proc quantreg .

L’esempio seguente mostra come eseguire nella pratica la regressione quantile in SAS.

Esempio: esecuzione della regressione quantile in SAS

Supponiamo di avere il seguente set di dati in SAS che mostra il numero di ore studiate e il punteggio dell’esame corrispondente per gli studenti di una classe:

 /*create dataset*/
data original_data;
    input hours score;
    datalines ;
1 75
1 79
2 78
2 83
2 85
3 84
3 84
3 89
4 93
4 88
4 79
4 94
5 96
5 98
;
run ;

/*view dataset*/
proc print data = original_data;

Successivamente, adatteremo un modello di regressione quantile utilizzando le ore studiate come variabile predittiva e i punteggi degli esami come variabile di risposta.

Utilizzeremo il modello per prevedere il 90° percentile previsto dei punteggi degli esami in base al numero di ore studiate:

 /*perform quantile regression*/
proc quantreg data =original_data;
    model score = hours / quantile = 0.9 ;
run ;

regressione quantile in SAS

Dal risultato possiamo vedere l’equazione di regressione stimata:

Punteggio esame 90° percentile = 76 + 4,5 (ore)

Ad esempio, il punteggio del 90° percentile di tutti gli studenti che studiano 2 ore dovrebbe essere 85:

90° percentile del punteggio dell’esame = 76 + 4,5*(2) = 85 .

L’output visualizza anche un grafico a dispersione dei dati grezzi con la linea di regressione adattata sovrapposta al grafico:

A differenza di un modello di regressione tradizionale, la linea adattata in questo modello di regressione passa attraverso il 90° percentile di ciascun valore della variabile predittiva invece che attraverso il valore medio.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in R:

Come eseguire una regressione lineare semplice in R
Come eseguire la regressione lineare multipla in R
Come eseguire la regressione quadratica in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *