Come calcolare l'rmse in sas
Un modo per valutare quanto bene un modello di regressione si adatta a un set di dati è calcolare l’ errore quadratico medio , che è una metrica che ci indica la distanza media tra i valori previsti del modello e i valori effettivi del set di dati.
Più basso è l’RMSE, migliore è la capacità di un dato modello di “adattarsi” a un set di dati.
La formula per trovare l’errore quadratico medio, spesso abbreviata RMSE , è:
RMSE = √ Σ(P i – O i ) 2 / n
Oro:
- Σ è un simbolo che rappresenta la “somma”
- Pi è il valore previsto per l’ iesima osservazione nel set di dati
- O i è il valore osservato per l’ iesima osservazione nel set di dati
- n è la dimensione del campione
Il seguente esempio passo passo mostra come calcolare l’RMSE per un modello di regressione lineare semplice in SAS.
Passaggio 1: creare i dati
Per questo esempio, creeremo un set di dati contenente il numero totale di ore studiate e il voto dell’esame finale di 15 studenti.
Adatteremo un semplice modello di regressione lineare utilizzando le ore come variabile predittiva e il punteggio come variabile di risposta.
Il codice seguente mostra come creare questo set di dati in SAS:
/*create dataset*/ data exam_data; input hours score; datalines ; 1 64 2 66 4 76 5 73 5 74 6 81 6 83 7 82 8 80 10 88 11 84 11 82 12 91 12 93 14 89 ; run ; /*view dataset*/ proc print data =exam_data;
Passaggio 2: adattare il modello di regressione lineare semplice
Successivamente, utilizzeremo proc reg per adattare il modello di regressione lineare semplice:
/*fit simple linear regression model*/ proc reg data =exam_data; model score = hours; run ;
Tieni presente che l’RMSE nell’output è 3.64093 .
Passaggio 3: estrarre l’RMSE dal modello di regressione
Se desideri visualizzare solo l’RMSE di questo modello e nessuno degli altri risultati di output, puoi utilizzare il seguente codice:
/*fit simple linear regression model*/ proc reg data =exam_data outest =outest noprint ; model score = hours / rmse ; run ; quit ; /*print RMSE of model*/ proc print data =outest; var _RMSE_; run ;
Tieni presente che nell’output viene visualizzato solo il valore RMSE di 3,64093 .
Nota : l’argomento noprint in proc reg indica a SAS di non stampare l’intero output dei risultati della regressione come nel passaggio precedente.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:
Come eseguire una regressione lineare semplice in SAS
Come eseguire la regressione lineare multipla in SAS
Come eseguire la regressione polinomiale in SAS
Come eseguire la regressione logistica in SAS