O que é um teste f parcial?
Um teste F parcial é usado para determinar se há ou não uma diferença estatisticamente significativa entre um modelo de regressão e uma versão aninhada do mesmo modelo.
Um modelo aninhado é simplesmente um modelo que contém um subconjunto de variáveis preditoras no modelo de regressão geral.
Por exemplo, suponha que temos o seguinte modelo de regressão com quatro variáveis preditoras:
Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε
Um exemplo de modelo aninhado seria o seguinte modelo com apenas duas das variáveis preditoras originais:
Y = β 0 + β 1 x 1 + β 2 x 2 + ε
Para determinar se esses dois modelos são significativamente diferentes, podemos realizar um teste F parcial.
Teste F parcial: o básico
Um teste F parcial calcula a seguinte estatística do teste F:
F = ((RSS reduzido – RSS completo )/p) / (RSS completo /nk)
Ouro:
- RSS reduzido : A soma residual dos quadrados do modelo reduzido (ou seja, “aninhado”).
- RSS completo : A soma residual dos quadrados do modelo completo.
- p: número de preditores removidos do modelo completo.
- n: o número total de observações no conjunto de dados.
- k: O número de coeficientes (incluindo o intercepto) no modelo completo.
Observe que a soma residual dos quadrados sempre será menor para o modelo completo, pois a adição de preditores sempre resultará em alguma redução no erro.
Portanto, um teste F parcial testa essencialmente se o grupo de preditores removido do modelo completo é realmente útil e deve ser incluído no modelo completo.
Este teste usa as seguintes hipóteses nulas e alternativas:
H 0 : Todos os coeficientes removidos do modelo completo são zero.
HA : Pelo menos um dos coeficientes removidos do modelo completo é diferente de zero.
Se o valor p correspondente à estatística do teste F estiver abaixo de um certo nível de significância (por exemplo, 0,05), então podemos rejeitar a hipótese nula e concluir que pelo menos um dos coeficientes removidos do modelo completo é significativo.
Teste F parcial: um exemplo
Na prática, usamos as seguintes etapas para realizar um teste F parcial:
1. Ajuste o modelo de regressão completo e calcule o RSS completo .
2. Ajuste o modelo de regressão aninhada e calcule o RSS reduzido .
3. Execute uma ANOVA para comparar o modelo completo e reduzido, o que produzirá a estatística do teste F necessária para comparar os modelos.
Por exemplo, o código a seguir mostra como ajustar os dois modelos de regressão a seguir em R usando dados do conjunto de dados integrado mtcars :
Modelo completo: mpg = β 0 + β 1 disponível + β 2 carb + β 3 hp + β 4 cil
Modelo: mpg = β 0 + β 1 disponível + β 2 carb
#fit full model model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars) #fit reduced model model_reduced <- lm(mpg ~ disp + carb, data = mtcars) #perform ANOVA to test for differences in models anova(model_reduced, model_full) Analysis of Variance Table Model 1: mpg ~ available + carb Model 2: mpg ~ disp + carb + hp + cyl Res.Df RSS Df Sum of Sq F Pr(>F) 1 29 254.82 2 27 238.71 2 16.113 0.9113 0.414
A partir do resultado, podemos ver que a estatística do teste F da ANOVA é 0,9113 e o valor p correspondente é 0,414 .
Como esse valor p não é inferior a 0,05, não conseguiremos rejeitar a hipótese nula. Isto significa que não temos evidências suficientes para dizer que qualquer uma das variáveis preditoras hp ou cil é estatisticamente significativa.
Em outras palavras, adicionar hp e cil ao modelo de regressão não melhora significativamente o ajuste do modelo.