Como calcular o rmse no sas


Uma maneira de avaliar quão bem um modelo de regressão se ajusta a um conjunto de dados é calcular o erro quadrático médio , que é uma métrica que nos informa a distância média entre os valores previstos do modelo e os valores reais do conjunto de dados.

Quanto menor o RMSE, melhor um determinado modelo é capaz de “ajustar” um conjunto de dados.

A fórmula para encontrar o erro quadrático médio, frequentemente abreviado como RMSE , é:

RMSE =Σ(P i – O i ) 2 / n

Ouro:

  • Σ é um símbolo que representa “soma”
  • Pi é o valor previsto para a i-ésima observação no conjunto de dados
  • O i é o valor observado para a i-ésima observação no conjunto de dados
  • n é o tamanho da amostra

O exemplo passo a passo a seguir mostra como calcular o RMSE para um modelo de regressão linear simples no SAS.

Etapa 1: crie os dados

Para este exemplo, criaremos um conjunto de dados contendo o total de horas estudadas e a nota do exame final de 15 alunos.

Ajustaremos um modelo de regressão linear simples usando horas como variável preditora e pontuação como variável resposta.

O código a seguir mostra como criar este conjunto de dados no SAS:

 /*create dataset*/
data exam_data;
    input hours score;
    datalines ;
1 64
2 66
4 76
5 73
5 74
6 81
6 83
7 82
8 80
10 88
11 84
11 82
12 91
12 93
14 89
;
run ;

/*view dataset*/
proc print data =exam_data;

Etapa 2: Ajustar o modelo de regressão linear simples

A seguir, usaremos proc reg para ajustar o modelo de regressão linear simples:

 /*fit simple linear regression model*/
proc reg data =exam_data;
    model score = hours;
run ; 

saída de regressão linear simples no SAS

Observe que o RMSE na saída é 3.64093 .

Etapa 3: Extraia o RMSE do modelo de regressão

Se quiser exibir apenas o RMSE deste modelo e nenhum dos outros resultados de saída, você pode usar o seguinte código:

 /*fit simple linear regression model*/
proc reg data =exam_data outest =outest noprint ;
    model score = hours / rmse ;
run ;
quit ;

/*print RMSE of model*/
proc print data =outest;
    var _RMSE_;
run ; 

Calcule RMSE no SAS

Observe que apenas o valor RMSE de 3,64093 é exibido na saída.

Nota : O argumento noprint em proc reg diz ao SAS para não imprimir toda a saída dos resultados da regressão como fez na etapa anterior.

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como realizar regressão linear simples no SAS
Como realizar regressão linear múltipla no SAS
Como realizar regressão polinomial no SAS
Como realizar regressão logística no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *