Intervalle de confiance pour la différence de proportions
Un intervalle de confiance (IC) pour une différence de proportions est une plage de valeurs susceptible de contenir la véritable différence entre deux proportions de population avec un certain niveau de confiance.
Ce tutoriel explique les éléments suivants :
- La motivation pour créer cet intervalle de confiance.
- La formule pour créer cet intervalle de confiance.
- Un exemple de la façon de calculer cet intervalle de confiance.
- Comment interpréter cet intervalle de confiance.
IC pour la différence de proportions : motivation
Les chercheurs souhaitent souvent estimer la différence entre deux proportions de population. Pour estimer cette différence, ils rassembleront un échantillon aléatoire de chaque population et calculeront la proportion pour chaque échantillon. Ensuite, ils peuvent comparer la différence entre les deux proportions.
Cependant, ils ne peuvent pas savoir avec certitude si la différence entre les proportions de l’échantillon correspond à la véritable différence entre les proportions de la population. C’est pourquoi ils peuvent créer un intervalle de confiance pour la différence entre les deux proportions. Cela fournit une plage de valeurs susceptible de contenir la véritable différence entre les proportions de la population.
Par exemple, supposons que nous souhaitions estimer la différence entre la proportion de résidents qui soutiennent une certaine loi dans le comté A et la proportion qui soutient la loi dans le comté B.
Puisqu’il y a des milliers d’habitants dans chaque comté, il serait trop long et trop coûteux de faire le tour et d’enquêter sur chaque résident individuel de chaque comté.
Au lieu de cela, nous pourrions prendre un échantillon aléatoire simple de résidents de chaque comté et utiliser la proportion en faveur de la loi dans chaque échantillon pour estimer la véritable différence de proportions entre les deux comtés :
Puisque nos échantillons sont aléatoires, il n’est pas garanti que la différence de proportions entre les deux échantillons corresponde exactement à la différence de proportions entre les deux populations. Ainsi, pour capturer cette incertitude, nous pouvons créer un intervalle de confiance contenant une plage de valeurs susceptibles de contenir la véritable différence de proportions entre les deux populations.
CI pour la différence de proportions : formule
Nous utilisons la formule suivante pour calculer un intervalle de confiance pour une différence entre deux proportions de population :
Intervalle de confiance = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )
où:
- p 1 , p 2 : proportion de l’échantillon 1, proportion de l’échantillon 2
- z : la valeur z-critique basée sur le niveau de confiance
- n 1 , n 2 : taille de l’échantillon 1, taille de l’échantillon 2
La valeur z que vous utiliserez dépend du niveau de confiance que vous choisissez. Le tableau suivant montre la valeur z qui correspond aux choix de niveaux de confiance les plus courants :
Un niveau de confiance | valeur z |
---|---|
0,90 | 1,645 |
0,95 | 1,96 |
0,99 | 2,58 |
Notez que des niveaux de confiance plus élevés correspondent à des valeurs z plus grandes, ce qui conduit à des intervalles de confiance plus larges. Cela signifie que, par exemple, un intervalle de confiance de 95 % sera plus large qu’un intervalle de confiance de 90 % pour le même ensemble de données.
CI pour la différence de proportions : exemple
Supposons que nous souhaitions estimer la différence entre la proportion de résidents qui soutiennent une certaine loi dans le comté A par rapport à la proportion qui soutient la loi dans le comté B. Voici les données récapitulatives pour chaque échantillon :
Échantillon 1 :
- n 1 = 100
- p 1 = 0,62 (soit 62 habitants sur 100 soutiennent la loi)
Échantillon 2 :
- n2 = 100
- p 2 = 0,46 (soit 46 habitants sur 100 soutiennent la loi)
Voici comment trouver différents intervalles de confiance pour la différence dans les proportions de population :
Intervalle de confiance à 90 % :
(.62-.46) +/- 1,645*√(.62(1-.62)/100 + .46(1-.46)/100) = [.0456, .2744]
Intervalle de confiance à 95 % :
(.62-.46) +/- 1,96*√(.62(1-.62)/100 + .46(1-.46)/100) = [.0236, .2964]
Intervalle de confiance à 99 % :
(0,62-0,46) +/- 2,58*√(0,62(1-0,62)/100 + 0,46(1-0,46)/100) = [-0,0192, 0,3392]
Remarque : Vous pouvez également trouver ces intervalles de confiance à l’aide de l’ Intervalle de confiance pour le calculateur de différence de proportions .
IC pour la différence de proportions : interprétation
La façon dont nous interpréterions un intervalle de confiance est la suivante :
Il y a 95 % de chances que l’intervalle de confiance de [.0236, .2964] contienne la véritable différence dans la proportion de résidents favorables à la loi entre les deux comtés.
Étant donné que cet intervalle ne contient pas la valeur « 0 », cela signifie qu’il est très probable qu’il existe une véritable différence dans la proportion de résidents qui soutiennent cette loi dans le comté A par rapport au comté B.