Como realizar um teste f parcial no excel
Um teste F parcial é usado para determinar se há ou não uma diferença estatisticamente significativa entre um modelo de regressão e uma versão aninhada do mesmo modelo.
Um modelo aninhado é simplesmente um modelo que contém um subconjunto de variáveis preditoras no modelo de regressão geral.
Por exemplo, suponha que temos o seguinte modelo de regressão com quatro variáveis preditoras:
Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε
Um exemplo de modelo aninhado seria o seguinte modelo com apenas duas das variáveis preditoras originais:
Y = β 0 + β 1 x 1 + β 2 x 2 + ε
Para determinar se esses dois modelos são significativamente diferentes, podemos realizar um teste F parcial, que calcula a seguinte estatística do teste F:
F = ((RSS reduzido – RSS completo )/p) / (RSS completo /nk)
Ouro:
- RSS reduzido : A soma residual dos quadrados do modelo reduzido (ou seja, “aninhado”).
- RSS completo : A soma residual dos quadrados do modelo completo.
- p: número de preditores removidos do modelo completo.
- n: o número total de observações no conjunto de dados.
- k: O número de coeficientes (incluindo o intercepto) no modelo completo.
Este teste usa as seguintes hipóteses nulas e alternativas:
H 0 : Todos os coeficientes removidos do modelo completo são zero.
HA : Pelo menos um dos coeficientes removidos do modelo completo é diferente de zero.
Se o valor p correspondente à estatística do teste F estiver abaixo de um certo nível de significância (por exemplo, 0,05), então podemos rejeitar a hipótese nula e concluir que pelo menos um dos coeficientes removidos do modelo completo é significativo.
O exemplo a seguir mostra como realizar um teste F parcial no Excel.
Exemplo: teste F parcial no Excel
Suponha que temos o seguinte conjunto de dados no Excel:
Suponha que queiramos determinar se há uma diferença entre os dois modelos de regressão a seguir:
Modelo completo: y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4
Modelo reduzido: y = β 0 + β 1 x 1 + β 2 x 2
Podemos realizaruma regressão linear múltipla no Excel para cada modelo para obter o seguinte resultado:
Podemos então usar a seguinte fórmula para calcular a estatística do teste F para o teste F parcial:
A estatística de teste acabou sendo 2.064 .
Podemos então usar a seguinte fórmula para calcular o valor p correspondente:
O valor p acaba sendo 0,1974 .
Como esse valor p não é inferior a 0,05, não conseguiremos rejeitar a hipótese nula. Isto significa que não temos evidências suficientes para dizer que qualquer uma das variáveis preditoras x3 ou x4 é estatisticamente significativa.
Em outras palavras, adicionar x3 e x4 ao modelo de regressão não melhora significativamente o ajuste do modelo.
Recursos adicionais
Como realizar regressão linear simples no Excel
Como realizar regressão linear múltipla no Excel
Como calcular o erro padrão de regressão no Excel