Como calcular vif no excel


A multicolinearidade na análise de regressão ocorre quando duas ou mais variáveis explicativas são altamente correlacionadas entre si, de modo que não fornecem informações únicas ou independentes no modelo de regressão. Se o grau de correlação entre as variáveis for alto o suficiente, isso pode causar problemas no ajuste e na interpretação do modelo de regressão.

Felizmente, é possível detectar multicolinearidade usando uma métrica chamada fator de inflação de variância (VIF) , que mede a correlação e a força da correlação entre variáveis explicativas em um modelo de regressão.

Este tutorial explica como calcular VIF no Excel.

Exemplo: calculando VIF no Excel

Para este exemplo, realizaremos regressão linear múltipla usando o seguinte conjunto de dados que descreve os atributos de 10 jogadores de basquete. Ajustaremos um modelo de regressão usando a classificação como variável de resposta e pontos, assistências e rebotes como variáveis explicativas. A seguir, identificaremos os valores VIF para cada variável explicativa.

Dados brutos no Excel

Etapa 1: execute a regressão linear múltipla.

Na faixa superior, vá para a guia Dados e clique em Análise de Dados. Se você não vir essa opção, primeiro instale o software Analysis ToolPak gratuito .

Pacote de ferramentas de análise de dados no Excel

Depois de clicar em Análise de Dados, uma nova janela aparecerá. Selecione Regressão e clique em OK.

Regressão com ferramentas de análise de dados no Excel

Preencha as tabelas necessárias para as variáveis de resposta e variáveis explicativas e clique em OK.

Regressão Múltipla no Excel

Isso produz o seguinte resultado:

Saída de regressão no Excel

Passo 2: Calcule o VIF para cada variável explicativa.

A seguir, podemos calcular o VIF para cada uma das três variáveis explicativas realizando regressões individuais usando uma variável explicativa como variável resposta e as outras duas como variáveis explicativas.

Por exemplo, podemos calcular o VIF para a variável pontos realizando uma regressão linear múltipla usando pontos como variável de resposta e assistências e rebotes como variáveis explicativas.

Isso produz o seguinte resultado:

Calcule VIF no Excel

O VIF para pontos é calculado como 1 / (1 – R Square) = 1 / (1 – 0,433099) = 1,76 .

Podemos então repetir esse processo para as outras duas variáveis, assistências e rebotes .

Acontece que os VIFs para as três variáveis explicativas são os seguintes:

pontos: 1,76
assistências: 1,96
rebotes: 1,18

Como interpretar valores VIF

O valor VIF começa em 1 e não tem limite superior. Uma regra geral para interpretar VIFs é:

  • Um valor 1 indica que não há correlação entre uma determinada variável explicativa e qualquer outra variável explicativa no modelo.
  • Um valor entre 1 e 5 indica uma correlação moderada entre uma determinada variável explicativa e outras variáveis explicativas no modelo, mas muitas vezes não é suficientemente grave para exigir atenção especial.
  • Um valor superior a 5 indica uma correlação potencialmente grave entre uma determinada variável explicativa e outras variáveis explicativas do modelo. Nesse caso, as estimativas dos coeficientes e os valores p nos resultados da regressão provavelmente não são confiáveis.

Como cada um dos valores VIF das variáveis explicativas em nosso modelo de regressão é fechado em 1, a multicolinearidade não é um problema em nosso exemplo.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *