O que é um modelo aninhado? (definição e #038; exemplo)


Um modelo aninhado é simplesmente um modelo de regressão que contém um subconjunto de variáveis preditoras em outro modelo de regressão.

Por exemplo, suponha que temos o seguinte modelo de regressão (vamos chamá-lo de Modelo A) que prevê o número de pontos marcados por um jogador de basquete com base em quatro variáveis preditoras:

Pontos = β 0 + β 1 (minutos) + β 2 (altura) + β 3 (posição) + β 4 (tiros) + ε

Um exemplo de modelo aninhado (vamos chamá-lo de Modelo B) seria o seguinte modelo com apenas duas das variáveis preditoras do Modelo A:

Pontos = β 0 + β 1 (minutos) + β 2 (altura) + ε

Diríamos que o Modelo B está aninhado no Modelo A porque o Modelo B contém um subconjunto das variáveis preditoras do Modelo A.

No entanto, considere se tivéssemos outro modelo (vamos chamá-lo de Modelo C) contendo três variáveis preditoras:

Pontos = β 0 + β 1 (minutos) + β 2 (altura) + β 3 (tentativas de lances livres)

Não diríamos que o Modelo C está aninhado no Modelo A porque cada modelo contém variáveis preditoras que o outro modelo não contém.

A importância dos modelos aninhados

Freqüentemente usamos modelos aninhados na prática quando queremos saber se um modelo com um conjunto completo de variáveis preditoras pode se ajustar melhor a um conjunto de dados do que um modelo com um subconjunto dessas variáveis preditoras.

Por exemplo, no cenário acima, poderíamos ajustar um modelo abrangente usando minutos jogados, altura, posição e arremessos tentados para prever o número de pontos marcados por jogadores de basquete.

No entanto, podemos suspeitar que a posição e as tentativas de remate podem não prever muito bem os pontos marcados.

Assim, poderíamos ajustar um modelo aninhado que usa apenas minutos jogados e arremesso para prever os pontos marcados.

Podemos então comparar os dois modelos para determinar se há uma diferença estatisticamente significativa.

Se não houver diferença significativa entre os modelos, podemos remover a posição e os disparos tentados como variáveis preditoras porque não melhoram significativamente o modelo.

Como analisar modelos aninhados

Para determinar se um modelo aninhado é significativamente diferente de um modelo “completo”, normalmente realizamos um teste de razão de verossimilhança que usa as seguintes hipóteses nulas e alternativas:

H 0 : O modelo completo e o modelo aninhado ajustam-se igualmente bem aos dados. Então, você deve usar modelo aninhado .

HA : O modelo completo ajusta os dados significativamente melhor do que o modelo aninhado. Então você tem que usar o modelo completo .

Um teste de razão de verossimilhança produz uma estatística de teste qui-quadrado e o valor p correspondente.

Se o valor p do teste estiver abaixo de um certo nível de significância (por exemplo, 0,05), então podemos rejeitar a hipótese nula e concluir que o modelo completo proporciona um ajuste significativamente melhor.

Os tutoriais a seguir explicam como realizar um teste de razão de verossimilhança usando R e Python:

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *