O que é um teste f parcial?


Um teste F parcial é usado para determinar se há ou não uma diferença estatisticamente significativa entre um modelo de regressão e uma versão aninhada do mesmo modelo.

Um modelo aninhado é simplesmente um modelo que contém um subconjunto de variáveis preditoras no modelo de regressão geral.

Por exemplo, suponha que temos o seguinte modelo de regressão com quatro variáveis preditoras:

Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε

Um exemplo de modelo aninhado seria o seguinte modelo com apenas duas das variáveis preditoras originais:

Y = β 0 + β 1 x 1 + β 2 x 2 + ε

Para determinar se esses dois modelos são significativamente diferentes, podemos realizar um teste F parcial.

Teste F parcial: o básico

Um teste F parcial calcula a seguinte estatística do teste F:

F = ((RSS reduzido – RSS completo )/p) / (RSS completo /nk)

Ouro:

  • RSS reduzido : A soma residual dos quadrados do modelo reduzido (ou seja, “aninhado”).
  • RSS completo : A soma residual dos quadrados do modelo completo.
  • p: número de preditores removidos do modelo completo.
  • n: o número total de observações no conjunto de dados.
  • k: O número de coeficientes (incluindo o intercepto) no modelo completo.

Observe que a soma residual dos quadrados sempre será menor para o modelo completo, pois a adição de preditores sempre resultará em alguma redução no erro.

Portanto, um teste F parcial testa essencialmente se o grupo de preditores removido do modelo completo é realmente útil e deve ser incluído no modelo completo.

Este teste usa as seguintes hipóteses nulas e alternativas:

H 0 : Todos os coeficientes removidos do modelo completo são zero.

HA : Pelo menos um dos coeficientes removidos do modelo completo é diferente de zero.

Se o valor p correspondente à estatística do teste F estiver abaixo de um certo nível de significância (por exemplo, 0,05), então podemos rejeitar a hipótese nula e concluir que pelo menos um dos coeficientes removidos do modelo completo é significativo.

Teste F parcial: um exemplo

Na prática, usamos as seguintes etapas para realizar um teste F parcial:

1. Ajuste o modelo de regressão completo e calcule o RSS completo .

2. Ajuste o modelo de regressão aninhada e calcule o RSS reduzido .

3. Execute uma ANOVA para comparar o modelo completo e reduzido, o que produzirá a estatística do teste F necessária para comparar os modelos.

Por exemplo, o código a seguir mostra como ajustar os dois modelos de regressão a seguir em R usando dados do conjunto de dados integrado mtcars :

Modelo completo: mpg = β 0 + β 1 disponível + β 2 carb + β 3 hp + β 4 cil

Modelo: mpg = β 0 + β 1 disponível + β 2 carb

 #fit full model
model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars)

#fit reduced model
model_reduced <- lm(mpg ~ disp + carb, data = mtcars)

#perform ANOVA to test for differences in models
anova(model_reduced, model_full)

Analysis of Variance Table

Model 1: mpg ~ available + carb
Model 2: mpg ~ disp + carb + hp + cyl
  Res.Df RSS Df Sum of Sq F Pr(>F)
1 29 254.82                           
2 27 238.71 2 16.113 0.9113 0.414

A partir do resultado, podemos ver que a estatística do teste F da ANOVA é 0,9113 e o valor p correspondente é 0,414 .

Como esse valor p não é inferior a 0,05, não conseguiremos rejeitar a hipótese nula. Isto significa que não temos evidências suficientes para dizer que qualquer uma das variáveis preditoras hp ou cil é estatisticamente significativa.

Em outras palavras, adicionar hp e cil ao modelo de regressão não melhora significativamente o ajuste do modelo.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *