La relation entre la taille de l’échantillon et la marge d’erreur
Souvent, dans les statistiques, nous souhaitons estimer la valeur de certains paramètres de population , tels qu’une proportion de population ou une moyenne de population .
Pour estimer ces valeurs, nous rassemblons généralement un échantillon aléatoire simple et calculons la proportion d’échantillon ou la moyenne de l’échantillon.
Nous construisons ensuite un intervalle de confiance pour capturer notre incertitude autour de ces estimations.
Nous utilisons la formule suivante pour calculer un intervalle de confiance pour une proportion de population :
Intervalle de confiance = p ± z*√ p(1-p) / n
où:
- p : proportion de l’échantillon
- z : la valeur z choisie
- n : taille de l’échantillon
Et nous utilisons la formule suivante pour calculer un intervalle de confiance pour une moyenne de population :
Intervalle de confiance = x̄ ± z*(s/√ n )
où:
- x̄ : moyenne de l’échantillon
- z : la valeur z choisie
- s : écart type de l’échantillon
- n : taille de l’échantillon
Dans les deux formules, il existe une relation inverse entre la taille de l’échantillon et la marge d’erreur.
Plus la taille de l’échantillon est grande, plus la marge d’erreur est faible. À l’inverse, plus la taille de l’échantillon est petite, plus la marge d’erreur est grande.
Consultez les deux exemples suivants pour mieux comprendre cela.
Exemple 1 : Taille de l’échantillon et marge d’erreur pour une proportion de population
Nous utilisons la formule suivante pour calculer un intervalle de confiance pour une proportion de population :
Intervalle de confiance = p ± z*√ p(1-p) / n
La partie en rouge est appelée marge d’erreur :
Intervalle de confiance = p ± z*√ p(1-p) / n
Notez que dans la marge d’erreur, nous divisons par n (la taille de l’échantillon).
Ainsi, lorsque la taille de l’échantillon est grande, nous divisons par un grand nombre, ce qui réduit la marge d’erreur totale. Cela conduit à un intervalle de confiance plus étroit.
Par exemple, supposons que nous collections un échantillon aléatoire simple de données avec les informations suivantes :
- p : 0,6
- n: 25
Voici comment calculer un intervalle de confiance de 95 % pour la proportion de population :
- Intervalle de confiance = p ± z*√ p(1-p) / n
- Intervalle de confiance = 0,6 ± 1,96*√ 0,6(1-0,6) / 25
- Intervalle de confiance = 0,6 ± 0,192
- Intervalle de confiance = [.408, .792]
Considérons maintenant si nous utilisions plutôt une taille d’échantillon de 200. Voici comment nous calculerions l’intervalle de confiance de 95 % pour la proportion de population :
- Intervalle de confiance = p ± z*√ p(1-p) / n
- Intervalle de confiance = 0,6 ± 1,96*√ 0,6(1-0,6) / 200
- Intervalle de confiance = 0,6 ± 0,068
- Intervalle de confiance = [.532, .668]
Notez qu’en augmentant simplement la taille de l’échantillon, nous avons pu réduire la marge d’erreur et produire un intervalle de confiance beaucoup plus étroit.
Exemple 2 : Taille de l’échantillon et marge d’erreur pour une moyenne de population
Nous utilisons la formule suivante pour calculer un intervalle de confiance pour une moyenne de population :
Intervalle de confiance = x̄ ± z*(s/√ n )
La partie en rouge est appelée marge d’erreur :
Intervalle de confiance = x̄ ± z*(s/√ n )
Notez que dans la marge d’erreur, nous divisons par n (la taille de l’échantillon).
Ainsi, lorsque la taille de l’échantillon est grande, nous divisons par un grand nombre, ce qui réduit la marge d’erreur totale. Cela conduit à un intervalle de confiance plus étroit.
Par exemple, supposons que nous collections un échantillon aléatoire simple de données avec les informations suivantes :
- x̄ : 15
- s : 4
- n: 25
Voici comment calculer un intervalle de confiance de 95 % pour la moyenne de la population :
- Intervalle de confiance = x̄ ± z*(s/√ n )
- Intervalle de confiance = 15 ± 1,96*(4/√ 25 )
- Intervalle de confiance = 15 ± 1,568
- Intervalle de confiance = [13,432, 16,568]
Considérons maintenant si nous utilisions plutôt une taille d’échantillon de 200. Voici comment nous calculerions l’intervalle de confiance à 95 % pour la moyenne de la population :
- Intervalle de confiance = x̄ ± z*(s/√ n )
- Intervalle de confiance = 15 ± 1,96*(4/√ 200 )
- Intervalle de confiance = 15 ± 0,554
- Intervalle de confiance = [14,446, 15,554]
Notez qu’en augmentant simplement la taille de l’échantillon, nous avons pu réduire la marge d’erreur et produire un intervalle de confiance plus étroit.
Ressources additionnelles
Les didacticiels suivants fournissent des informations supplémentaires sur les intervalles de confiance pour une proportion :
- Une introduction aux intervalles de confiance pour une proportion
- Intervalle de confiance pour le calculateur de proportion
Les didacticiels suivants fournissent des informations supplémentaires sur les intervalles de confiance pour une moyenne :