Interpolação ou extrapolação: qual a diferença?
Dois termos que os estudantes muitas vezes confundem em estatística são interpolação e extrapolação .
Aqui está a diferença:
A interpolação refere-se à previsão de valores que se enquadram em um intervalo de pontos de dados.
Extrapolação refere-se à previsão de valores que estão fora de um intervalo de pontos de dados.
O exemplo a seguir ilustra a diferença entre os dois termos.
Exemplo: interpolação e extrapolação
Suponha que temos o seguinte conjunto de dados:
Podemos decidir ajustar um modelo de regressão linear simples a estes pontos:
Poderíamos então usar o modelo de regressão ajustado para prever valores de pontos dentro e fora do intervalo de pontos de dados.
Quando usamos o modelo de regressão ajustado para prever os valores dos pontos dentro do intervalo existente de pontos de dados, isso é chamado de interpolação.
Por outro lado, quando usamos o modelo de regressão ajustado para prever valores de pontos fora do intervalo existente, isso é chamado de extrapolação :
O perigo potencial da extrapolação
Quando extrapolamos, assumimos que o mesmo padrão que existe dentro do intervalo atual de pontos de dados também existe fora do intervalo.
No entanto, esta pode ser uma suposição perigosa porque é possível que o padrão que existe fora do intervalo atual de pontos de dados seja muito diferente:
Por esse motivo, pode ser perigoso usar extrapolação para prever valores de pontos de dados que estão fora do intervalo de valores usado para criar o modelo de regressão.
Na prática, muitas vezes faz sentido usar extrapolação para prever valores de pontos que estão ligeiramente fora da faixa de valores existentes, mas quanto mais longe da faixa se vai, mais provável é que a diferença entre o valor previsto e o valor real o valor é importante. .
Quando usar extrapolação
Muitas vezes é necessário conhecimento específico do domínio para determinar se a extrapolação é uma ideia razoável ou não.
Por exemplo, suponha que o departamento de marketing de uma empresa aplique um modelo de regressão linear simples usando gastos com publicidade como variável preditora e receita total como variável resposta.
Neste cenário, pode ser razoável supor que um aumento constante nos gastos com publicidade resultará num aumento previsível na receita total:
Neste cenário, podemos estar bastante confiantes na nossa capacidade de extrapolar valores.
No entanto, considere um cenário em que um biólogo queira usar fertilizante total para prever o crescimento das plantas.
Ela pode decidir ajustar um modelo de regressão linear simples aos pontos de dados, mas como existe um limite superior para a altura das plantas, provavelmente não faz sentido usar a extrapolação para prever os valores dos pontos. fora da faixa de valores. valores usados para ajustar o modelo:
Neste cenário, poderíamos ter muito menos confiança na nossa capacidade de extrapolar valores.
Conclusão: a extrapolação pode fazer mais sentido em algumas áreas do que em outras, mas sempre existe o perigo potencial de que o modelo que existe na faixa de valores usada para ajustar o modelo não exista fora da praia.
Recursos adicionais
Como realizar interpolação linear no Excel
Como fazer previsões com regressão linear