Como calcular resíduos padronizados no excel
Um resíduo é a diferença entre um valor observado e um valor previsto em um modelo de regressão .
É calculado da seguinte forma:
Residual = Valor observado – Valor previsto
Se plotarmos os valores observados e sobrepormos a linha de regressão ajustada, os resíduos de cada observação seriam a distância vertical entre a observação e a linha de regressão:
Um tipo de resíduo que costumamos usar para identificar valores discrepantes em um modelo de regressão é chamado de resíduo padronizado .
É calculado da seguinte forma:
r eu = e eu / s(e eu ) = e eu / RSE√ 1-h ii
Ouro:
- e i : O i- ésimo resíduo
- RSE: erro padrão residual do modelo
- h ii : O surgimento da i-ésima observação
Na prática, muitas vezes consideramos qualquer resíduo padronizado cujo valor absoluto seja superior a 3 como um valor atípico.
Este tutorial fornece um exemplo passo a passo de como calcular resíduos padronizados no Excel.
Passo 1: Insira os dados
Primeiro, inseriremos valores de um pequeno conjunto de dados no Excel:
Passo 2: Calcular os resíduos
A seguir, navegaremos até a guia Dados na faixa superior e clicaremos em Análise de Dados no grupo Análise :
Se você ainda não instalou este suplemento, confira este tutorial para saber como. É fácil de instalar e totalmente gratuito.
Depois de clicar em Análise de Dados, clique na opção que diz Regressão e clique em OK . Na nova janela que aparece, preencha as seguintes informações e clique em OK :
O resíduo de cada observação aparecerá no resultado:
Copie e cole esses resíduos em uma nova coluna próxima aos dados originais:
Etapa 3: calcular a alavancagem
A seguir, precisamos calcular a alavancagem de cada observação.
A imagem a seguir mostra como fazer isso:
Aqui estão as fórmulas usadas nas diferentes células:
- B14: =CONTAR(B2:B13)
- B15: = MÉDIA (B2: B13)
- B16: =DESVQ(B2:B13)
- E2: =1/$B$14+(B2-$B$15)^2/$B$16
Passo 4: Calcular resíduos padronizados
Finalmente, podemos calcular os resíduos padronizados usando a fórmula:
r eu = e eu / RSE√ 1-h ii
A RSC do modelo pode ser encontrada nos resultados do modelo anterior. Acontece que é 4,44 :
Assim, podemos utilizar a seguinte fórmula para calcular o resíduo padronizado para cada observação:
A partir dos resultados, podemos ver que nenhum dos resíduos padronizados excede o valor absoluto de 3. Assim, nenhuma das observações parece ser discrepante.
Deve-se notar que, em alguns casos, os pesquisadores consideram observações cujos resíduos padronizados excedem um valor absoluto de 2 como outliers.
Depende de você usar um valor absoluto de 2 ou 3 como limite para valores discrepantes, dependendo do problema específico no qual você está trabalhando.
Recursos adicionais
O que são resíduos?
O que são resíduos padronizados?
Introdução à regressão linear múltipla