Régression logarithmique
Cet article explique ce qu’est la régression logarithmique et comment elle est effectuée. De plus, vous pouvez voir un exemple de régression logarithmique pour bien comprendre le concept.
Qu’est-ce que la régression logarithmique ?
La régression logarithmique est un modèle de régression qui inclut un logarithme dans son équation. Plus précisément, dans une régression logarithmique, le logarithme de la variable indépendante est pris. Ainsi, l’équation d’un modèle de régression logarithmique est y=a+b·ln(x).
La régression logarithmique est très utile pour ajuster un modèle de régression lorsque les données de l’échantillon forment une courbe logarithmique, afin que le modèle de régression s’adapte mieux aux données de l’échantillon. Ci-dessous, nous verrons quand vous devez effectuer une régression logarithmique.
Ainsi, la régression logarithmique est un type de régression non linéaire, au même titre que la régression exponentielle et la régression polynomiale.
Formule de régression logarithmique
Un modèle de régression logarithmique consiste à prendre le logarithme de la variable indépendante. Par conséquent, la formule de l’équation d’une régression logarithmique est y=a+b·ln(x).
Où:
- est la variable dépendante.
- est la variable indépendante.
- sont les coefficients de régression.
Notez que y=a+b·ln(x) est en fait l’équation d’une droite, mais au lieu de faire référence aux variables d’origine x et y, elle fait référence aux variables ln(x) et y.
Quand faire une régression logarithmique ?
Nous devons effectuer une régression logarithmique lorsque le graphique des données de l’échantillon est une courbe logarithmique, c’est-à-dire lorsque le tracé des points est similaire au graphique d’une fonction logarithmique.
Regardez le nuage de points ci-dessous, un modèle de régression linéaire a été adapté à un ensemble de données. Comme vous pouvez le voir, la ligne n’est pas une mauvaise approximation des données, cependant, si vous faites attention, les valeurs augmentent plus rapidement au début du graphique qu’à la fin, de sorte que la ligne ne correspond pas complètement aux observations.
Cela vaut donc la peine d’essayer de créer un modèle de régression logarithmique, car il semble que les données suivent une courbe logarithmique. Le résultat obtenu à partir du modèle de régression logarithmique est le suivant :
Comme vous pouvez le voir dans le graphique précédent, le modèle de régression logarithmique obtenu s’adapte mieux à l’échantillon de données. En fait, le coefficient de détermination est passé de 66,87 % à 80,05 %, de sorte que le modèle peut désormais mieux expliquer l’échantillon de données. Par conséquent, dans ce cas, il est préférable d’utiliser la régression logistique pour trouver une équation qui se rapproche de la valeur des données.
Autres types de régression non linéaire
Les trois cas les plus courants de régression non linéaire sont les suivants :
- Régression logarithmique : le logarithme de la variable indépendante est pris.
- Régression exponentielle : La variable indépendante est l’exposant de l’équation.
- Régression polynomiale : L’équation du modèle de régression se présente sous la forme d’un polynôme.