Intervalle de confiance pour un coefficient de corrélation
Un intervalle de confiance pour un coefficient de corrélation est une plage de valeurs susceptible de contenir un coefficient de corrélation de population avec un certain niveau de confiance.
Ce tutoriel explique les éléments suivants :
- La motivation pour créer ce type d’intervalle de confiance.
- La formule pour créer ce type d’intervalle de confiance.
- Un exemple de la façon de créer ce type d’intervalle de confiance.
- Comment interpréter ce type d’intervalle de confiance.
Intervalle de confiance pour un coefficient de corrélation : motivation
La raison pour laquelle il faut créer un intervalle de confiance pour un coefficient de corrélation est de capturer notre incertitude lors de l’estimation d’un coefficient de corrélation de population.
Par exemple, supposons que nous souhaitions estimer le coefficient de corrélation entre la taille et le poids des habitants d’un certain comté. Comme il y a des milliers d’habitants dans le comté, il serait trop coûteux et trop long de faire le tour et de recueillir des informations sur la taille et le poids de chaque habitant.
Au lieu de cela, nous pourrions sélectionner un échantillon aléatoire simple de résidents et simplement recueillir des informations à leur sujet.
Puisque nous sélectionnons un échantillon aléatoire de résidents, rien ne garantit que le coefficient de corrélation entre la taille et le poids de ces résidents de l’échantillon correspondra exactement au coefficient de corrélation de la population plus large.
Ainsi, pour capturer cette incertitude, nous pouvons créer un intervalle de confiance contenant une plage de valeurs susceptibles de contenir le véritable coefficient de corrélation entre la taille et le poids des résidents de ce comté.
Intervalle de confiance pour un coefficient de corrélation : formule
Nous utilisons les étapes suivantes pour calculer un intervalle de confiance pour un coefficient de corrélation de population, basé sur la taille de l’échantillon n et le coefficient de corrélation de l’échantillon r .
Étape 1 : Effectuez la transformation de Fisher.
Soit z r = ln((1+r) / (1-r)) / 2
Étape 2 : Trouvez les limites supérieure et inférieure du journal.
Soit L = z r – (z 1-α/2 /√ n-3 )
Soit U = z r + (z 1-α/2 /√ n-3 )
Étape 3 : Trouvez l’intervalle de confiance.
L’intervalle de confiance final peut être trouvé à l’aide de la formule suivante :
Intervalle de confiance = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
Intervalle de confiance pour un coefficient de corrélation : exemple
Supposons que nous souhaitions estimer le coefficient de corrélation entre la taille et le poids des résidents d’un certain comté. Nous sélectionnons un échantillon aléatoire de 30 résidents et trouvons les informations suivantes :
- Taille de l’échantillon n = 30
- Coefficient de corrélation entre la taille et le poids r = 0,56
Voici comment trouver un intervalle de confiance à 95 % pour le coefficient de corrélation de population :
Étape 1 : Effectuez la transformation de Fisher.
Soit z r = ln((1+r) / (1-r)) / 2 = ln((1+.56) / (1-.56)) / 2 = 0,6328
Étape 2 : Trouvez les limites supérieure et inférieure du journal.
Soit L = z r – (z 1-α/2 /√ n-3 ) = 0,6328 – (1,96 /√ 30-3 ) = 0,2556
Soit U = z r + (z 1-α/2 /√ n-3 ) = 0,6328 + (1,96 /√ 30-3 ) = 1,01
Étape 3 : Trouvez l’intervalle de confiance.
Intervalle de confiance = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
Intervalle de confiance = [(e 2(.2556) -1)/(e 2(.2556) +1), (e 2(1.01) -1)/(e 2(1.01) +1)] = [.2502 , .7658]
Remarque : Vous pouvez également trouver cet intervalle de confiance à l’aide de l’ Intervalle de confiance pour un calculateur de coefficient de corrélation .
Intervalle de confiance pour un coefficient de corrélation : interprétation
La façon dont nous interpréterions un intervalle de confiance est la suivante :
Il y a 95 % de chances que l’intervalle de confiance de [.2502, .7658] contienne le véritable coefficient de corrélation de la population entre la taille et le poids des résidents de ce comté.
Une autre façon de dire la même chose est qu’il n’y a que 5 % de chances que le véritable coefficient de corrélation de la population se situe en dehors de l’intervalle de confiance de 95 %.
Autrement dit, il n’y a que 5 % de chances que le véritable coefficient de corrélation de la population entre la taille et le poids des résidents de ce comté soit inférieur à 0,2502 ou supérieur à 0,7658.