Intervalle de confiance
Cet article explique ce qu’est un intervalle de confiance dans les statistiques et à quoi il sert. Vous trouverez également les facteurs qui influencent les intervalles de confiance et la manière dont un intervalle de confiance est calculé.
Qu’est-ce qu’un intervalle de confiance ?
En statistique, l’ intervalle de confiance est un intervalle qui donne une approximation des valeurs entre lesquelles se situe la valeur d’un paramètre de population avec un certain niveau de confiance. Les intervalles de confiance les plus courants ont un niveau de confiance de 95 % ou 99 %.
Par exemple, si l’intervalle de confiance pour la moyenne d’une population avec un niveau de confiance de 95 % est (3,7), cela signifie que la moyenne de la population étudiée sera comprise entre 3 et 7 avec une probabilité de 95 %.
Par conséquent, l’intervalle de confiance est utilisé pour estimer deux valeurs entre lesquelles se situe un paramètre de population. Généralement, les valeurs des paramètres de population sont inconnues, donc un intervalle de confiance est calculé à partir des données d’un échantillon pour avoir une estimation des paramètres de population.
Facteurs influençant l’intervalle de confiance
Une fois que nous aurons vu la définition de l’intervalle de confiance, nous allons voir quels sont les facteurs dont dépendent les intervalles de confiance pour mieux comprendre le concept.
- Taille de l’échantillon : le nombre d’observations étudiées influence la précision de l’intervalle de confiance, puisque plus on dispose de données, plus une valeur peut être estimée. En général, plus la taille de l’échantillon est grande, plus la largeur de l’intervalle de confiance est petite.
- Marge d’erreur : plus l’erreur admissible est grande, plus l’intervalle de confiance est grand, et donc plus il est probable que la valeur réelle du paramètre se situe dans l’intervalle de confiance. Cependant, la marge d’erreur diminue la précision de l’intervalle de confiance.
- Niveau de confiance : est la probabilité que l’estimation de la statistique de population se situe dans l’intervalle de confiance. Généralement, le niveau de confiance d’un intervalle est indiqué par 1-α et est exprimé en pourcentage. Un niveau de confiance élevé augmente la probabilité que la valeur réelle se situe entre les limites de l’intervalle, mais augmente également la largeur de l’intervalle.
- Le paramètre estimé : l’intervalle de confiance dépend du paramètre à approximer. En fait, la formule à utiliser pour calculer l’intervalle de confiance dépend du paramètre approximatif.
Comment calculer l’intervalle de confiance
La formule à appliquer pour calculer chaque type d’intervalle de confiance est présentée ci-dessous, car selon que l’on souhaite déterminer l’intervalle de confiance pour la moyenne, la variance ou la proportion, la formule à utiliser est différente.
Intervalle de confiance pour la moyenne
Partant du fait que le processus de typage d’une variable se fait comme suit :
L’intervalle de confiance pour la moyenne est calculé en ajoutant et en soustrayant de la moyenne de l’échantillon la valeur de Z α/2 multipliée par l’écart type (σ) et divisée par la racine carrée de la taille de l’échantillon (n). Par conséquent, la formule pour calculer l’intervalle de confiance de la moyenne est la suivante :
Pour des échantillons de grande taille et un niveau de confiance de 95 %, la valeur critique est Z α/2 = 1,96 et pour un niveau de confiance de 99 %, la valeur critique est Z α/2 = 2,576.
La formule ci-dessus est utilisée lorsque la variance de la population est connue. Cependant, si la variance de la population est inconnue, ce qui est le cas le plus courant, l’intervalle de confiance pour la moyenne est calculé à l’aide de la formule suivante :
Où:
- est la moyenne de l’échantillon.
- est la valeur de la distribution t de Student de n-1 degrés de liberté avec une probabilité α/2.
- est l’écart type de l’échantillon.
- est la taille de l’échantillon.
Intervalle de confiance pour la variance
Pour calculer l’intervalle de confiance pour la variance d’une population, la distribution du chi carré est utilisée. Plus précisément, la formule pour calculer l’intervalle de confiance pour la variance est la suivante :
Où:
- est la taille de l’échantillon.
- est l’écart type de l’échantillon.
- est la valeur de la distribution du Chi carré avec n-1 degrés de liberté pour une probabilité inférieure à α/2.
- est la valeur de la distribution du Chi carré avec n-1 degrés de liberté pour une probabilité supérieure à 1-α/2.
Intervalle de confiance pour la proportion
L’intervalle de confiance pour la proportion est calculé en ajoutant et en soustrayant de la proportion de l’échantillon la valeur de Z α/2 multipliée par la racine carrée de la proportion de l’échantillon (p) multipliée par 1-p et divisée par la taille de l’échantillon ( n). Par conséquent, la formule pour calculer l’intervalle de confiance pour la proportion est la suivante :
Où:
- est la proportion de l’échantillon.
- est la taille de l’échantillon.
- est le quantile de la distribution normale standard correspondant à une probabilité de α/2. Pour des échantillons de grande taille et un niveau de confiance de 95 %, il est généralement proche de 1,96 et pour un niveau de confiance de 99 %, il est généralement proche de 2,576.