Como calcular resíduos padronizados no excel


Um resíduo é a diferença entre um valor observado e um valor previsto em um modelo de regressão .

É calculado da seguinte forma:

Residual = Valor observado – Valor previsto

Se plotarmos os valores observados e sobrepormos a linha de regressão ajustada, os resíduos de cada observação seriam a distância vertical entre a observação e a linha de regressão:

Exemplo de resíduo nas estatísticas

Um tipo de resíduo que costumamos usar para identificar valores discrepantes em um modelo de regressão é chamado de resíduo padronizado .

É calculado da seguinte forma:

r eu = e eu / s(e eu ) = e eu / RSE√ 1-h ii

Ouro:

  • e i : O i- ésimo resíduo
  • RSE: erro padrão residual do modelo
  • h ii : O surgimento da i-ésima observação

Na prática, muitas vezes consideramos qualquer resíduo padronizado cujo valor absoluto seja superior a 3 como um valor atípico.

Este tutorial fornece um exemplo passo a passo de como calcular resíduos padronizados no Excel.

Passo 1: Insira os dados

Primeiro, inseriremos valores de um pequeno conjunto de dados no Excel:

Passo 2: Calcular os resíduos

A seguir, navegaremos até a guia Dados na faixa superior e clicaremos em Análise de Dados no grupo Análise :

Se você ainda não instalou este suplemento, confira este tutorial para saber como. É fácil de instalar e totalmente gratuito.

Depois de clicar em Análise de Dados, clique na opção que diz Regressão e clique em OK . Na nova janela que aparece, preencha as seguintes informações e clique em OK :

O resíduo de cada observação aparecerá no resultado:

Resíduos no Excel

Copie e cole esses resíduos em uma nova coluna próxima aos dados originais:

Etapa 3: calcular a alavancagem

A seguir, precisamos calcular a alavancagem de cada observação.

A imagem a seguir mostra como fazer isso:

Aproveitando o cálculo no Excel para estatísticas

Aqui estão as fórmulas usadas nas diferentes células:

  • B14: =CONTAR(B2:B13)
  • B15: = MÉDIA (B2: B13)
  • B16: =DESVQ(B2:B13)
  • E2: =1/$B$14+(B2-$B$15)^2/$B$16

Passo 4: Calcular resíduos padronizados

Finalmente, podemos calcular os resíduos padronizados usando a fórmula:

r eu = e eu / RSE√ 1-h ii

A RSC do modelo pode ser encontrada nos resultados do modelo anterior. Acontece que é 4,44 :

Assim, podemos utilizar a seguinte fórmula para calcular o resíduo padronizado para cada observação:

Resíduos padronizados no Excel

A partir dos resultados, podemos ver que nenhum dos resíduos padronizados excede o valor absoluto de 3. Assim, nenhuma das observações parece ser discrepante.

Deve-se notar que, em alguns casos, os pesquisadores consideram observações cujos resíduos padronizados excedem um valor absoluto de 2 como outliers.

Depende de você usar um valor absoluto de 2 ou 3 como limite para valores discrepantes, dependendo do problema específico no qual você está trabalhando.

Recursos adicionais

O que são resíduos?
O que são resíduos padronizados?
Introdução à regressão linear múltipla

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *