O que é um modelo aninhado? (definição e #038; exemplo)
Um modelo aninhado é simplesmente um modelo de regressão que contém um subconjunto de variáveis preditoras em outro modelo de regressão.
Por exemplo, suponha que temos o seguinte modelo de regressão (vamos chamá-lo de Modelo A) que prevê o número de pontos marcados por um jogador de basquete com base em quatro variáveis preditoras:
Pontos = β 0 + β 1 (minutos) + β 2 (altura) + β 3 (posição) + β 4 (tiros) + ε
Um exemplo de modelo aninhado (vamos chamá-lo de Modelo B) seria o seguinte modelo com apenas duas das variáveis preditoras do Modelo A:
Pontos = β 0 + β 1 (minutos) + β 2 (altura) + ε
Diríamos que o Modelo B está aninhado no Modelo A porque o Modelo B contém um subconjunto das variáveis preditoras do Modelo A.
No entanto, considere se tivéssemos outro modelo (vamos chamá-lo de Modelo C) contendo três variáveis preditoras:
Pontos = β 0 + β 1 (minutos) + β 2 (altura) + β 3 (tentativas de lances livres)
Não diríamos que o Modelo C está aninhado no Modelo A porque cada modelo contém variáveis preditoras que o outro modelo não contém.
A importância dos modelos aninhados
Freqüentemente usamos modelos aninhados na prática quando queremos saber se um modelo com um conjunto completo de variáveis preditoras pode se ajustar melhor a um conjunto de dados do que um modelo com um subconjunto dessas variáveis preditoras.
Por exemplo, no cenário acima, poderíamos ajustar um modelo abrangente usando minutos jogados, altura, posição e arremessos tentados para prever o número de pontos marcados por jogadores de basquete.
No entanto, podemos suspeitar que a posição e as tentativas de remate podem não prever muito bem os pontos marcados.
Assim, poderíamos ajustar um modelo aninhado que usa apenas minutos jogados e arremesso para prever os pontos marcados.
Podemos então comparar os dois modelos para determinar se há uma diferença estatisticamente significativa.
Se não houver diferença significativa entre os modelos, podemos remover a posição e os disparos tentados como variáveis preditoras porque não melhoram significativamente o modelo.
Como analisar modelos aninhados
Para determinar se um modelo aninhado é significativamente diferente de um modelo “completo”, normalmente realizamos um teste de razão de verossimilhança que usa as seguintes hipóteses nulas e alternativas:
H 0 : O modelo completo e o modelo aninhado ajustam-se igualmente bem aos dados. Então, você deve usar modelo aninhado .
HA : O modelo completo ajusta os dados significativamente melhor do que o modelo aninhado. Então você tem que usar o modelo completo .
Um teste de razão de verossimilhança produz uma estatística de teste qui-quadrado e o valor p correspondente.
Se o valor p do teste estiver abaixo de um certo nível de significância (por exemplo, 0,05), então podemos rejeitar a hipótese nula e concluir que o modelo completo proporciona um ajuste significativamente melhor.
Os tutoriais a seguir explicam como realizar um teste de razão de verossimilhança usando R e Python: