Como calcular o rmse no sas
Uma maneira de avaliar quão bem um modelo de regressão se ajusta a um conjunto de dados é calcular o erro quadrático médio , que é uma métrica que nos informa a distância média entre os valores previstos do modelo e os valores reais do conjunto de dados.
Quanto menor o RMSE, melhor um determinado modelo é capaz de “ajustar” um conjunto de dados.
A fórmula para encontrar o erro quadrático médio, frequentemente abreviado como RMSE , é:
RMSE = √ Σ(P i – O i ) 2 / n
Ouro:
- Σ é um símbolo que representa “soma”
- Pi é o valor previsto para a i-ésima observação no conjunto de dados
- O i é o valor observado para a i-ésima observação no conjunto de dados
- n é o tamanho da amostra
O exemplo passo a passo a seguir mostra como calcular o RMSE para um modelo de regressão linear simples no SAS.
Etapa 1: crie os dados
Para este exemplo, criaremos um conjunto de dados contendo o total de horas estudadas e a nota do exame final de 15 alunos.
Ajustaremos um modelo de regressão linear simples usando horas como variável preditora e pontuação como variável resposta.
O código a seguir mostra como criar este conjunto de dados no SAS:
/*create dataset*/ data exam_data; input hours score; datalines ; 1 64 2 66 4 76 5 73 5 74 6 81 6 83 7 82 8 80 10 88 11 84 11 82 12 91 12 93 14 89 ; run ; /*view dataset*/ proc print data =exam_data;
Etapa 2: Ajustar o modelo de regressão linear simples
A seguir, usaremos proc reg para ajustar o modelo de regressão linear simples:
/*fit simple linear regression model*/ proc reg data =exam_data; model score = hours; run ;
Observe que o RMSE na saída é 3.64093 .
Etapa 3: Extraia o RMSE do modelo de regressão
Se quiser exibir apenas o RMSE deste modelo e nenhum dos outros resultados de saída, você pode usar o seguinte código:
/*fit simple linear regression model*/ proc reg data =exam_data outest =outest noprint ; model score = hours / rmse ; run ; quit ; /*print RMSE of model*/ proc print data =outest; var _RMSE_; run ;
Observe que apenas o valor RMSE de 3,64093 é exibido na saída.
Nota : O argumento noprint em proc reg diz ao SAS para não imprimir toda a saída dos resultados da regressão como fez na etapa anterior.
Recursos adicionais
Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:
Como realizar regressão linear simples no SAS
Como realizar regressão linear múltipla no SAS
Como realizar regressão polinomial no SAS
Como realizar regressão logística no SAS