Como construir um intervalo de previsão no excel


Em estatística, a regressão linear simples é uma técnica que podemos usar para quantificar a relação entre uma variável preditora, x, e uma variável de resposta, y.

Quando realizamos uma regressão linear simples, obtemos uma “linha de melhor ajuste” que descreve a relação entre x e y, que pode ser escrita como:

ŷ=b 0 + b 1 x

Ouro:

  • ŷ é o valor previsto da variável de resposta
  • b 0 é a interceptação y
  • b 1 é o coeficiente de regressão
  • x é o valor da variável preditora

Às vezes queremos usar esta linha de melhor ajuste para construir um intervalo de previsão para um determinado valor de x 0 , que é um intervalo em torno do valor previsto ŷ 0 tal que haja uma probabilidade de 95% de que o verdadeiro valor de y na população correspondente a x 0 está incluído neste intervalo.

A fórmula para calcular o intervalo de previsão para um determinado valor x 0 é escrita:

ŷ 0 +/- t α/2,df=n-2 * se

Ouro:

se = S yx √(1 + 1/n + (x 0x ) 2 /SS x )

A fórmula pode parecer um pouco intimidante, mas na verdade é simples de calcular no Excel. A seguir veremos um exemplo de uso desta fórmula para calcular um intervalo de previsão para um determinado valor no Excel.

Exemplo: como construir um intervalo de previsão no Excel

O conjunto de dados a seguir mostra o número de horas estudadas, bem como a nota do exame obtida por 15 alunos diferentes:

Exemplo de conjunto de dados no Excel

Suponha que queiramos criar um intervalo de previsão de 95% para o valor x 0 = 3. Ou seja, queremos criar um intervalo tal que haja 95% de probabilidade de que a nota do exame fique dentro desse intervalo para um aluno que estuda para 3 horas.

A captura de tela a seguir mostra como calcular todos os valores necessários para obter esse intervalo de previsão.

Nota: As fórmulas da coluna F mostram como foram calculados os valores da coluna E.

Como calcular um intervalo de previsão no Excel

O intervalo de previsão de 95% para um valor de x 0 = 3 é (74,64, 86,90) . Ou seja, prevemos com 95% de probabilidade que um aluno que estude 3 horas obterá uma nota entre 74,64 e 86,90.

Algumas notas sobre os cálculos utilizados:

  • Para calcular o valor t-crítico de t α/2,df=n-2, usamos α/2 = 0,05/2 = 0,25, pois queríamos um intervalo de predição de 95%. Observe que intervalos de previsão mais altos (por exemplo, intervalo de previsão de 99%) levarão a intervalos mais amplos. Por outro lado, um intervalo de previsão menor (por exemplo, um intervalo de previsão de 90%) levará a um intervalo mais estreito.
  • Usamos a fórmula =FORECAST() para obter o valor previsto para ŷ 0 , mas a fórmula =FORECAST.LINEAR() retornará exatamente o mesmo valor.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *