Como realizar regressão quadrática no excel
A regressão é uma técnica estatística que podemos usar para explicar a relação entre uma ou mais variáveis preditoras e uma variável de resposta. O tipo mais comum de regressão é a regressão linear , que usamos quando a relação entre a variável preditora e a variável resposta é linear .
Em outras palavras, quando a variável preditora aumenta, a variável resposta tende a aumentar também. Por exemplo, podemos usar um modelo de regressão linear para descrever a relação entre o número de horas estudadas (variável preditora) e a nota que um aluno recebe em um exame (variável resposta).
No entanto, às vezes a relação entre uma variável preditora e uma variável de resposta é não linear . Um tipo comum de relacionamento não linear é o relacionamento quadrático , que pode parecer um U ou um U invertido em um gráfico.
Ou seja, à medida que a variável preditora aumenta, a variável resposta tende a aumentar também, mas depois de um certo ponto a variável resposta começa a diminuir à medida que a variável preditora continua a aumentar.
Por exemplo, podemos usar um modelo de regressão quadrática para descrever a relação entre o número de horas gastas trabalhando e o nível de felicidade relatado por uma pessoa. Talvez quanto mais uma pessoa trabalha, mais realizada ela se sente, mas quando atinge um certo limite, mais trabalho na verdade leva ao estresse e à diminuição da felicidade. Nesse caso, um modelo de regressão quadrática ajustaria melhor os dados do que um modelo de regressão linear.
Vamos revisar um exemplo de como realizar regressão quadrática no Excel.
Regressão quadrática no Excel
Suponha que temos dados sobre o número de horas trabalhadas por semana e o nível de felicidade relatado (numa escala de 0 a 100) para 16 pessoas diferentes:
Primeiro, vamos criar um gráfico de dispersão para ver se a regressão linear é um modelo adequado para ajustar os dados.
Destaque as células A2:B17 . Em seguida, clique na guia INSERT na faixa superior e clique em Dispersão na área Gráficos . Isso produzirá um gráfico de dispersão dos dados:
É fácil perceber que a relação entre horas trabalhadas e felicidade relatada não é linear. Na verdade, ele segue o formato de “U”, o que o torna um candidato perfeito para regressão quadrática .
Antes de ajustar o modelo de regressão quadrática aos dados, precisamos criar uma nova coluna para os valores quadrados de nossa variável preditora.
Primeiro, destaque todos os valores na coluna B e arraste-os para a coluna C.
Em seguida, digite a fórmula =A2^2 na célula B2. Isso produz o valor 36 . Em seguida, clique no canto inferior direito da célula B2 e arraste a fórmula para baixo para preencher as células restantes na coluna B.
A seguir, ajustaremos o modelo de regressão quadrática.
Clique em DADOS na faixa superior e, a seguir, clique na opção Análise de dados na extrema direita. Se você não vir essa opção, primeiro instale o software Analysis ToolPak gratuito .
Depois de clicar em Análise de dados , uma caixa aparecerá. Clique em Regressão e em OK .
A seguir, preencha os seguintes valores na caixa Regressão que aparece. Em seguida, clique em OK .
Os seguintes resultados serão exibidos:
Veja como interpretar os diferentes números na saída:
R Quadrado: Também conhecido como coeficiente de determinação, é a proporção da variância na variável resposta que pode ser explicada pelas variáveis preditoras. Neste exemplo, o R quadrado é 0,9092 , indicando que 90,92% da variação nos níveis de felicidade relatados pode ser explicada pelo número de horas trabalhadas e pelo número de horas trabalhadas ^2.
Erro padrão: O erro padrão da regressão é a distância média entre os valores observados e a linha de regressão. Neste exemplo, os valores observados desviam em média 9.519 unidades da linha de regressão.
Estatística F : A estatística F é calculada como regressão MS/MS residual. Esta estatística indica se o modelo de regressão proporciona um melhor ajuste aos dados do que um modelo que não contém variáveis independentes. Essencialmente, testa se o modelo de regressão como um todo é útil. Geralmente, se nenhuma das variáveis preditoras no modelo for estatisticamente significativa, a estatística F geral também não será estatisticamente significativa. Neste exemplo, a estatística F é 65,09 e o valor p correspondente é <0,0001. Como este valor p é inferior a 0,05, o modelo de regressão como um todo é significativo.
Coeficientes de regressão: Os coeficientes de regressão na última tabela nos fornecem os números necessários para escrever a equação de regressão estimada:
y chapéu = b 0 + b 1 x 1 + b 2 x 1 2
Neste exemplo, a equação de regressão estimada é:
nível de felicidade declarado = -30,252 + 7,173 (Horas trabalhadas) -0,106 (Horas trabalhadas) 2
Podemos usar esta equação para calcular o nível de felicidade esperado de um indivíduo com base nas horas trabalhadas. Por exemplo, o nível de felicidade esperado de uma pessoa que trabalha 30 horas por semana é:
nível relatado de felicidade = -30,252 + 7,173(30) -0,106(30) 2 = 88,649 .
Recursos adicionais
Como adicionar uma linha de tendência quadrática no Excel
Como ler e interpretar uma tabela de regressão
O que é um bom valor de R ao quadrado?
Compreendendo o erro padrão da regressão
Um guia simples para compreender o teste F de significância geral na regressão