Come calcolare l'rmse in sas


Un modo per valutare quanto bene un modello di regressione si adatta a un set di dati è calcolare l’ errore quadratico medio , che è una metrica che ci indica la distanza media tra i valori previsti del modello e i valori effettivi del set di dati.

Più basso è l’RMSE, migliore è la capacità di un dato modello di “adattarsi” a un set di dati.

La formula per trovare l’errore quadratico medio, spesso abbreviata RMSE , è:

RMSE =Σ(P i – O i ) 2 / n

Oro:

  • Σ è un simbolo che rappresenta la “somma”
  • Pi è il valore previsto per l’ iesima osservazione nel set di dati
  • O i è il valore osservato per l’ iesima osservazione nel set di dati
  • n è la dimensione del campione

Il seguente esempio passo passo mostra come calcolare l’RMSE per un modello di regressione lineare semplice in SAS.

Passaggio 1: creare i dati

Per questo esempio, creeremo un set di dati contenente il numero totale di ore studiate e il voto dell’esame finale di 15 studenti.

Adatteremo un semplice modello di regressione lineare utilizzando le ore come variabile predittiva e il punteggio come variabile di risposta.

Il codice seguente mostra come creare questo set di dati in SAS:

 /*create dataset*/
data exam_data;
    input hours score;
    datalines ;
1 64
2 66
4 76
5 73
5 74
6 81
6 83
7 82
8 80
10 88
11 84
11 82
12 91
12 93
14 89
;
run ;

/*view dataset*/
proc print data =exam_data;

Passaggio 2: adattare il modello di regressione lineare semplice

Successivamente, utilizzeremo proc reg per adattare il modello di regressione lineare semplice:

 /*fit simple linear regression model*/
proc reg data =exam_data;
    model score = hours;
run ; 

output di regressione lineare semplice in SAS

Tieni presente che l’RMSE nell’output è 3.64093 .

Passaggio 3: estrarre l’RMSE dal modello di regressione

Se desideri visualizzare solo l’RMSE di questo modello e nessuno degli altri risultati di output, puoi utilizzare il seguente codice:

 /*fit simple linear regression model*/
proc reg data =exam_data outest =outest noprint ;
    model score = hours / rmse ;
run ;
quit ;

/*print RMSE of model*/
proc print data =outest;
    var _RMSE_;
run ; 

Calcola RMSE in SAS

Tieni presente che nell’output viene visualizzato solo il valore RMSE di 3,64093 .

Nota : l’argomento noprint in proc reg indica a SAS di non stampare l’intero output dei risultati della regressione come nel passaggio precedente.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:

Come eseguire una regressione lineare semplice in SAS
Come eseguire la regressione lineare multipla in SAS
Come eseguire la regressione polinomiale in SAS
Come eseguire la regressione logistica in SAS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *