Inferência e previsão: qual a diferença?
Muitas vezes, nas estatísticas, queremos usar dados por um de dois motivos:
(1) Inferência: Queremos compreender a natureza da relação entre as variáveis preditoras e a variável resposta em um conjunto de dados existente.
(2) Previsão: Queremos usar um conjunto de dados existente para construir um modelo que preveja o valor da variável resposta de uma nova observação.
Por exemplo, suponha que temos o seguinte conjunto de dados contendo informações sobre casas:
Um exemplo de inferência:
Suponha que construímos um modelo de regressão linear múltipla usando metragem quadrada, número de quartos e número de banheiros como variáveis preditoras e preço como variável resposta.
Poderíamos então utilizar os coeficientes de regressão para compreender a variação média no preço associada a uma alteração de uma unidade em cada uma das variáveis preditoras.
Por exemplo, poderíamos entender quanto o preço muda (em média) com cada quarto adicional, cada banheiro adicional e cada metro quadrado adicional.
Um exemplo de previsão:
Poderíamos construir o mesmo modelo de regressão linear múltipla e usá-lo para prever o valor de uma nova casa com base em sua metragem quadrada, número de quartos e número de banheiros.
Por exemplo, poderíamos usar o modelo para prever o preço de uma casa nova com 3 quartos, 3 banheiros e 2.000 pés quadrados.
Poderíamos então comparar a nossa previsão com o preço de listagem real e avaliar se a casa parece subvalorizada ou sobrevalorizada.
Os exemplos a seguir ilustram a diferença entre inferência e previsão em diferentes cenários:
Exemplo 1: Inferência e previsão em esportes
Suponha que temos o seguinte conjunto de dados contendo informações sobre times profissionais de basquete:
Um exemplo de inferência:
Suponha que construímos um modelo de regressão linear múltipla usando pontos, rebotes e assistências como variáveis preditoras e vitórias como variável de resposta.
Poderíamos então usar o modelo para entender o quanto o número de vitórias muda (em média) com cada ponto, rebote e assistência adicional.
Um exemplo de previsão:
Poderíamos construir o mesmo modelo de regressão linear múltipla e usá-lo para prever quantas vitórias uma equipe terá com base no número de pontos, rebotes e assistências.
Por exemplo, poderíamos usar o modelo para prever quantas vitórias uma equipe com 90 pontos, 40 rebotes e 30 assistências terá.
Exemplo 2: Inferência e previsão nos negócios
Suponha que temos o seguinte conjunto de dados contendo informações sobre as receitas anuais (em milhões) de várias empresas:
Um exemplo de inferência:
Suponha que construímos um modelo de regressão linear múltipla usando gastos com publicidade, número de funcionários e aquisições totais como variáveis preditoras e receita anual como variável resposta.
Poderíamos então usar o modelo para entender o quanto a receita anual total muda (em média) com cada dólar adicional gasto em publicidade, cada funcionário adicional e cada aquisição adicional.
Um exemplo de previsão:
Poderíamos construir o mesmo modelo de regressão linear múltipla e usá-lo para prever a receita anual de uma empresa com base em seus gastos totais com marketing, número de funcionários e total de aquisições.
Por exemplo, poderíamos usar o modelo para prever a receita anual de uma empresa que gasta US$ 25 milhões em publicidade, tem 40 funcionários e fez 2 aquisições.
Recursos adicionais
Os tutoriais a seguir fornecem informações adicionais sobre termos importantes para entender em estatística:
Estatística descritiva ou inferencial: qual a diferença?
Níveis de medição: nominal, ordinal, intervalo e razão
Variáveis qualitativas e quantitativas: qual a diferença?