Niveau de confiance et intervalle de confiance : quelle est la différence ?
Souvent, dans les statistiques, nous cherchons à mesurer les paramètres d’une population – des nombres qui décrivent certaines caractéristiques d’une population entière.
Par exemple, nous pourrions être intéressés à mesurer la taille moyenne des hommes dans un certain pays.
Comme il est trop coûteux et trop long de collecter des données sur la taille de chaque homme dans le pays, nous collecterions plutôt des données sur un simple échantillon aléatoire d’hommes. Nous utiliserions ensuite la taille moyenne des hommes de cet échantillon pour estimer la taille moyenne de tous les hommes du pays.
Malheureusement, il n’est pas garanti que la taille moyenne des hommes de l’échantillon corresponde exactement à la taille moyenne des hommes de l’ensemble de la population. Par exemple, il se peut que nous choisissions un échantillon composé d’hommes plus petits ou peut-être un échantillon composé d’hommes plus grands.
Afin de capturer notre incertitude autour de notre estimation de la véritable moyenne de la population, nous pouvons créer un intervalle de confiance.
Intervalle de confiance : plage de valeurs susceptible de contenir un paramètre de population avec un certain niveau de confiance.
Un intervalle de confiance est calculé à l’aide de la formule générale suivante :
Intervalle de confiance = (estimation ponctuelle) +/- (valeur critique)* (erreur standard)
Par exemple, la formule permettant de calculer un intervalle de confiance pour une moyenne de population est la suivante :
Intervalle de confiance = x +/- z*(s/√ n )
où:
- x : moyenne de l’échantillon
- z : la valeur critique de z
- s : écart type de l’échantillon
- n : taille de l’échantillon
La valeur critique z que vous utiliserez dans la formule dépend du niveau de confiance que vous choisissez.
Niveau de confiance : pourcentage de tous les échantillons possibles qui devraient inclure le véritable paramètre de population.
Les choix les plus courants pour les niveaux de confiance sont 90 %, 95 % et 99 %.
Le tableau suivant montre la valeur critique z qui correspond à ces choix de niveaux de confiance populaires :
Un niveau de confiance | z valeur critique |
---|---|
0,90 | 1,645 |
0,95 | 1,96 |
0,99 | 2,58 |
Par exemple, supposons que nous mesurions la taille de 25 hommes et que nous trouvions ce qui suit :
- Taille de l’échantillon n = 25
- Hauteur moyenne de l’échantillon x = 70 pouces
- Échantillon d’écart type s = 1,2 pouces
Voici comment calculer un intervalle de confiance pour la taille moyenne réelle de la population en utilisant un niveau de confiance de 90 % :
Intervalle de confiance à 90 % : 70 +/- 1,645*(1,2/√25) = [69,6052, 70,3948]
Cela signifie que si nous utilisions la même méthode d’échantillonnage pour sélectionner différents échantillons et calculions un intervalle de confiance pour chaque échantillon, nous nous attendrions à ce que la taille moyenne réelle de la population se situe dans l’intervalle dans 90 % des cas.
Supposons maintenant que nous calculions plutôt un intervalle de confiance en utilisant un niveau de confiance de 95 % :
Intervalle de confiance à 95 % : 70 +/- 1,96*(1,2/√25) = [69,5296, 70,4704]
Notez que cet intervalle de confiance est plus large que le précédent. En effet, plus le niveau de confiance est élevé, plus l’intervalle de confiance est large.
Plus le niveau de confiance est élevé, plus l’intervalle de confiance est large.
Cela devrait avoir du sens intuitivement : un niveau de confiance plus large a une probabilité plus élevée de contenir un véritable paramètre de population.
Résumé
En résumé:
Un intervalle de confiance est une plage de valeurs susceptible de contenir un paramètre de population avec un certain niveau de confiance. Il utilise la formule de base suivante :
Intervalle de confiance = (estimation ponctuelle) +/- (valeur critique)* (erreur standard)
Le niveau de confiance détermine la valeur critique à utiliser dans cette formule. Plus le niveau de confiance est élevé, plus la valeur critique est grande et donc plus l’intervalle de confiance est large.
Ressources additionnelles
Introduction aux intervalles de confiance
Introduction aux tests d’hypothèses
Qu’est-ce qu’une estimation ponctuelle ?