Como calcular vif no excel
A multicolinearidade na análise de regressão ocorre quando duas ou mais variáveis explicativas são altamente correlacionadas entre si, de modo que não fornecem informações únicas ou independentes no modelo de regressão. Se o grau de correlação entre as variáveis for alto o suficiente, isso pode causar problemas no ajuste e na interpretação do modelo de regressão.
Felizmente, é possível detectar multicolinearidade usando uma métrica chamada fator de inflação de variância (VIF) , que mede a correlação e a força da correlação entre variáveis explicativas em um modelo de regressão.
Este tutorial explica como calcular VIF no Excel.
Exemplo: calculando VIF no Excel
Para este exemplo, realizaremos regressão linear múltipla usando o seguinte conjunto de dados que descreve os atributos de 10 jogadores de basquete. Ajustaremos um modelo de regressão usando a classificação como variável de resposta e pontos, assistências e rebotes como variáveis explicativas. A seguir, identificaremos os valores VIF para cada variável explicativa.
Etapa 1: execute a regressão linear múltipla.
Na faixa superior, vá para a guia Dados e clique em Análise de Dados. Se você não vir essa opção, primeiro instale o software Analysis ToolPak gratuito .
Depois de clicar em Análise de Dados, uma nova janela aparecerá. Selecione Regressão e clique em OK.
Preencha as tabelas necessárias para as variáveis de resposta e variáveis explicativas e clique em OK.
Isso produz o seguinte resultado:
Passo 2: Calcule o VIF para cada variável explicativa.
A seguir, podemos calcular o VIF para cada uma das três variáveis explicativas realizando regressões individuais usando uma variável explicativa como variável resposta e as outras duas como variáveis explicativas.
Por exemplo, podemos calcular o VIF para a variável pontos realizando uma regressão linear múltipla usando pontos como variável de resposta e assistências e rebotes como variáveis explicativas.
Isso produz o seguinte resultado:
O VIF para pontos é calculado como 1 / (1 – R Square) = 1 / (1 – 0,433099) = 1,76 .
Podemos então repetir esse processo para as outras duas variáveis, assistências e rebotes .
Acontece que os VIFs para as três variáveis explicativas são os seguintes:
pontos: 1,76
assistências: 1,96
rebotes: 1,18
Como interpretar valores VIF
O valor VIF começa em 1 e não tem limite superior. Uma regra geral para interpretar VIFs é:
- Um valor 1 indica que não há correlação entre uma determinada variável explicativa e qualquer outra variável explicativa no modelo.
- Um valor entre 1 e 5 indica uma correlação moderada entre uma determinada variável explicativa e outras variáveis explicativas no modelo, mas muitas vezes não é suficientemente grave para exigir atenção especial.
- Um valor superior a 5 indica uma correlação potencialmente grave entre uma determinada variável explicativa e outras variáveis explicativas do modelo. Nesse caso, as estimativas dos coeficientes e os valores p nos resultados da regressão provavelmente não são confiáveis.
Como cada um dos valores VIF das variáveis explicativas em nosso modelo de regressão é fechado em 1, a multicolinearidade não é um problema em nosso exemplo.