Comment trouver le coefficient de corrélation à partir de R2



Vous pouvez trouver le coefficient de corrélation entre deux variables en prenant la racine carrée de la valeur R au carré (R 2 ) d’un modèle de régression linéaire simple.

Coefficient de corrélation = √ R 2 du modèle de régression linéaire simple

Le signe du coefficient de pente dans le modèle de régression vous indique si le coefficient de corrélation est positif ou négatif.

Les exemples suivants montrent comment trouver le coefficient de corrélation à partir de la valeur R au carré d’un modèle de régression dans la pratique.

Remarque : La valeur R au carré d’un modèle de régression est également appelée coefficient de détermination.

Exemple 1 : Trouver le coefficient de corrélation à partir de R 2 (lorsque la pente est positive)

Supposons que nous ajustions un modèle de régression linéaire simple en utilisant les heures étudiées comme variable prédictive et les résultats à l’examen comme variable de réponse.

Supposons que nous recevions le résultat suivant du modèle :

Équation de régression ajustée : score d’examen = 65,55 + 2,78 (heures étudiées)

R-carré (R 2 ) du modèle de régression : 0,7845

La valeur R au carré du modèle nous indique quel pourcentage de variation des résultats aux examens peut être expliqué par les heures étudiées.

Dans cet exemple, nous pouvons voir que les heures étudiées sont capables d’expliquer 78,45 % de la variation des résultats aux examens.

Pour trouver le coefficient de corrélation entre les heures étudiées et les résultats des examens, on peut prendre la racine carrée de R 2 :

Coefficient de corrélation = √ R 2 = √ 0,7845 = 0,8857

Le signe étant positif pour les heures étudiées dans l’équation de régression, ce coefficient de corrélation est positif.

Ainsi, le coefficient de corrélation entre les heures étudiées et la note à l’examen est de 0,8857 .

Exemple 2 : Trouver le coefficient de corrélation à partir de R 2 (lorsque la pente est négative)

Supposons que nous ajustions un modèle de régression linéaire simple en utilisant l’âge (en années) comme variable prédictive et le développé couché maximum (en livres) comme variable de réponse.

Supposons que nous recevions le résultat suivant du modèle :

Équation de régression ajustée : développé couché maximum = 240,11 – 1,24 (âge)

R au carré (R 2 ) du modèle de régression : 0,4773

La valeur R au carré du modèle nous indique quel pourcentage de variation des livres maximales au développé couché peut être expliqué par l’âge.

Dans cet exemple, nous pouvons voir que l’âge est capable d’expliquer 47,73% de la variation du montant maximum du développé couché.

Pour trouver le coefficient de corrélation entre âge et développé couché max, on peut prendre la racine carrée de R 2 :

Coefficient de corrélation = √ R 2 = √ 0,4773 = 0,6909

Le signe de l’âge étant négatif dans l’équation de régression, ce coefficient de corrélation est négatif.

Ainsi, le coefficient de corrélation entre l’âge et le développé couché maximum est de -0,6909 .

Ressources additionnelles

Les didacticiels suivants fournissent des informations supplémentaires sur les coefficients de corrélation :

Qu’est-ce qui est considéré comme une corrélation « forte » ?
Quand devriez-vous utiliser la corrélation ?
Comment effectuer un test t de corrélation

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *