Como testar a multicolinearidade no spss
A multicolinearidade na análise de regressão ocorre quando duas ou mais variáveis preditoras são altamente correlacionadas entre si, de modo que não fornecem informações únicas ou independentes no modelo de regressão. Se o grau de correlação entre as variáveis for alto o suficiente, isso pode causar problemas no ajuste e na interpretação do modelo de regressão.
Uma maneira de detectar a multicolinearidade é usar uma métrica conhecida como fator de inflação de variância (VIF) , que mede a correlação e a força da correlação entre variáveis preditoras em um modelo de regressão.
Este tutorial explica como usar VIF para detectar multicolinearidade em análise de regressão no SPSS.
Exemplo: multicolinearidade no SPSS
Suponha que temos o seguinte conjunto de dados que mostra a nota do exame de 10 alunos junto com o número de horas que eles passaram estudando, o número de exames práticos que fizeram e a nota atual no curso:
Gostaríamos de realizar uma regressão linear usando score como variável de resposta e hours , prep_exams e current_grade como variáveis preditoras, mas queremos ter certeza de que as três variáveis preditoras não estão altamente correlacionadas.
Para determinar se a multicolinearidade é um problema, podemos produzir valores VIF para cada uma das variáveis preditoras.
Para fazer isso, clique na guia Analisar , depois em Regressão e depois em Linear :
Na nova janela que aparece, arraste a pontuação para a caixa denominada Dependente e arraste as três variáveis preditoras para a caixa denominada Independente(s). Em seguida, clique em Estatísticas e certifique-se de que a caixa esteja marcada ao lado de Diagnóstico de Colinearidade . Em seguida, clique em Continuar . Em seguida, clique em OK .
Depois de clicar em OK , a tabela a seguir aparece mostrando o valor VIF para cada variável preditora:
Os valores VIF para cada uma das variáveis preditoras são os seguintes:
- horas: 1.169
- exames_prep: 1.403
- pontuação_atual: 1,522
O valor VIF começa em 1 e não tem limite superior. Uma regra geral para interpretar VIFs é:
- Um valor 1 indica que não há correlação entre uma determinada variável preditora e qualquer outra variável preditora no modelo.
- Um valor entre 1 e 5 indica uma correlação moderada entre uma determinada variável preditora e outras variáveis preditoras no modelo, mas muitas vezes não é suficientemente grave para exigir atenção especial.
- Um valor superior a 5 indica uma correlação potencialmente séria entre uma determinada variável preditora e outras variáveis preditoras no modelo. Nesse caso, as estimativas dos coeficientes e os valores p nos resultados da regressão provavelmente não são confiáveis.
Podemos ver que nenhum dos valores VIF para as variáveis preditoras neste exemplo é maior que 5, indicando que a multicolinearidade não será um problema no modelo de regressão.