Regressão logarítmica
Este artigo explica o que é regressão logarítmica e como ela é realizada. Além disso, você pode ver um exemplo de regressão logarítmica para compreender totalmente o conceito.
O que é regressão logarítmica?
A regressão logarítmica é um modelo de regressão que inclui um logaritmo em sua equação. Especificamente, em uma regressão logarítmica, é obtido o logaritmo da variável independente. Portanto, a equação para um modelo de regressão logarítmica é y=a+b·ln(x).
A regressão logarítmica é muito útil para ajustar um modelo de regressão quando os dados amostrais formam uma curva logarítmica, para que o modelo de regressão se ajuste melhor aos dados amostrais. Abaixo veremos quando você deve realizar a regressão logarítmica.
Assim, a regressão logarítmica é um tipo de regressão não linear, assim como a regressão exponencial e a regressão polinomial.
Fórmula de regressão logarítmica
Um modelo de regressão logarítmica envolve tomar o logaritmo da variável independente. Portanto, a fórmula para a equação de uma regressão logarítmica é y=a+b·ln(x).
Ouro:
-
é a variável dependente.
-
é a variável independente.
-
são os coeficientes de regressão.
Observe que y=a+b·ln(x) é na verdade a equação de uma reta, mas em vez de se referir às variáveis originais x e y, refere-se às variáveis ln(x) e y.
Quando fazer regressão logarítmica?
Precisamos realizar a regressão logarítmica quando o gráfico dos dados amostrais for uma curva logarítmica, ou seja, quando o gráfico dos pontos for semelhante ao gráfico de uma função logarítmica.
Observe o gráfico de dispersão abaixo, um modelo de regressão linear foi ajustado a um conjunto de dados. Como você pode ver, a linha não é uma má aproximação dos dados, porém, se você tomar cuidado, os valores aumentam mais rapidamente no início do gráfico do que no final, então a linha não corresponde completamente às observações .
Portanto, vale a pena tentar criar um modelo de regressão logarítmica, porque parece que os dados seguem uma curva logarítmica. O resultado obtido do modelo de regressão logarítmica é o seguinte:
Como você pode ver no gráfico anterior, o modelo de regressão logarítmica resultante se ajusta melhor aos dados da amostra. Na verdade, o coeficiente de determinação aumentou de 66,87% para 80,05%, pelo que o modelo pode agora explicar melhor a amostra de dados. Portanto, neste caso, é melhor utilizar a regressão logística para encontrar uma equação que se aproxime do valor dos dados.
Outros tipos de regressão não linear
Os três casos mais comuns de regressão não linear são:
- Regressão logarítmica : é obtido o logaritmo da variável independente.
- Regressão exponencial : A variável independente é o expoente da equação.
- Regressão Polinomial : A equação do modelo de regressão está na forma de um polinômio.