Como realizar regressão linear simples no excel


A regressão linear simples é um método que podemos usar para compreender a relação entre uma variável explicativa, x, e uma variável de resposta, y.

Este tutorial explica como realizar uma regressão linear simples no Excel.

Exemplo: Regressão Linear Simples no Excel

Suponha que queiramos compreender a relação entre o número de horas que um aluno estuda para um exame e a nota que recebe no exame.

Para explorar essa relação, podemos realizar uma regressão linear simples usando horas estudadas como variável explicativa e notas em exames como variável resposta.

Conclua as etapas a seguir no Excel para realizar uma regressão linear simples.

Passo 1: Insira os dados.

Insira os seguintes dados para o número de horas estudadas e nota do exame obtida para 20 alunos:

Dados brutos no Excel

Etapa 2: visualize os dados.

Antes de realizar uma regressão linear simples, é útil criar um gráfico de dispersão dos dados para garantir que realmente exista uma relação linear entre as horas estudadas e a nota do exame.

Destaque os dados nas colunas A e B. Na faixa superior do Excel, navegue até a guia Inserir . No grupo Gráficos , clique em Inserir Dispersão (X, Y) e clique na primeira opção denominada Dispersão . Isso produzirá automaticamente a seguinte nuvem de pontos:

Gráfico de dispersão no Excel

O número de horas estudadas é mostrado no eixo x e os resultados dos exames são mostrados no eixo y. Podemos perceber que existe uma relação linear entre as duas variáveis: mais horas de estudo estão associadas a notas mais altas nos exames.

Para quantificar a relação entre essas duas variáveis, podemos realizar uma regressão linear simples.

Etapa 3: execute uma regressão linear simples.

Na faixa superior do Excel, vá para a guia Dados e clique em Análise de Dados . Se você não vir essa opção, primeiro instale o software Analysis ToolPak gratuito .

Opção de análise de dados no Excel

Depois de clicar em Análise de Dados, uma nova janela aparecerá. Selecione Regressão e clique em OK.

Opção de regressão no Excel Data Analysis Toolpak

Para Input Y Range , preencha a matriz de valores da variável de resposta. Para Input X Range , preencha a matriz de valores da variável explicativa.

Marque a caixa ao lado de Rótulos para informar ao Excel que incluímos os nomes das variáveis nos intervalos de entrada.

Para Output Range , selecione uma célula na qual deseja que a saída da regressão apareça.

Em seguida, clique em OK .

Regressão no Excel

A seguinte saída aparecerá automaticamente:

Saída de regressão linear simples no Excel

Etapa 4: interprete o resultado.

Veja como interpretar os números mais relevantes no resultado:

R Quadrado: 0,7273 . Isso é chamado de coeficiente de determinação. É a proporção da variância na variável resposta que pode ser explicada pela variável explicativa. Neste exemplo, 72,73% da variação nas notas dos exames é explicada pela quantidade de horas estudadas.

Erro padrão: 5,2805 . Esta é a distância média entre os valores observados e a linha de regressão. Neste exemplo, os valores observados desviam-se em média 5,2805 unidades da linha de regressão.

F: 47.9952 . Esta é a estatística F geral para o modelo de regressão, calculada como regressão MS/MS residual.

Significado F: 0,0000 . Este é o valor p associado à estatística F geral. Isto nos diz se o modelo de regressão é estatisticamente significativo ou não. Em outras palavras, diz-nos se a variável explicativa tem uma associação estatisticamente significativa com a variável resposta. Neste caso, o valor p é inferior a 0,05, indicando que existe associação estatisticamente significativa entre as horas cursadas e a nota obtida no exame.

Coeficientes: Os coeficientes nos fornecem os números necessários para escrever a equação de regressão estimada. Neste exemplo, a equação de regressão estimada é:

nota do exame = 67,16 + 5,2503*(horas)

Interpretamos o coeficiente de horas como significando que para cada hora adicional estudada, a nota do exame deve aumentar em média 5,2503 . Interpretamos o coeficiente da interceptação como significando que a nota esperada no exame para um aluno que estuda zero horas é 67,16 .

Podemos usar esta equação de regressão estimada para calcular a nota esperada no exame de um aluno, com base no número de horas de estudo.

Por exemplo, um aluno que estuda três horas deverá obter nota 82,91 no exame:

nota do exame = 67,16 + 5,2503*(3) = 82,91

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns no Excel:

Como criar um gráfico residual no Excel
Como construir um intervalo de previsão no Excel
Como criar um gráfico QQ no Excel

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *