Quelle est la condition de succès/échec en statistiques ?



Un essai de Bernoulli est une expérience avec seulement deux résultats possibles – « succès » ou « échec » – et la probabilité de succès est la même à chaque fois que l’expérience est menée.

Un exemple d’essai de Bernoulli est un tirage au sort. La pièce ne peut atterrir que sur deux faces (on pourrait appeler face un « succès » et face un « échec ») et la probabilité de succès à chaque lancer est de 0,5, en supposant que la pièce soit juste.

Souvent, en statistique, lorsque nous voulons calculer des probabilités impliquant plus que quelques essais de Bernoulli, nous utilisons ladistribution normale comme approximation. Cependant, pour ce faire, nous devons vérifier que la condition de réussite/échec est remplie :

Condition de réussite/échec : Il doit y avoir au moins 10 succès attendus et 10 échecs attendus dans un échantillon afin d’utiliser la distribution normale comme approximation.

Écrit en notation, nous devons vérifier les deux éléments suivants :

  • Le nombre de réussites attendu est d’au moins 10 : np ≥ 10
  • Le nombre d’échecs attendu est d’au moins 10 : n(1-p) ≥ 10

n est la taille de l’échantillon et p est la probabilité de réussite d’un essai donné.

Remarque : Certains manuels disent plutôt que seuls 5 succès attendus et 5 échecs attendus sont nécessaires pour utiliser l’approximation normale. Cependant, 10 est plus couramment utilisé et constitue un nombre plus conservateur. Nous utiliserons donc ce nombre dans ce didacticiel.

Exemple : Vérification de la condition de réussite/échec

Supposons que nous souhaitions créer un intervalle de confiance pour la proportion de résidents d’un comté favorables à une certaine loi. Nous sélectionnons un échantillon aléatoire de 100 résidents et leur demandons quelle est leur position sur la loi. Voici les résultats:

  • Taille de l’échantillon n = 100
  • Proportion en faveur de la loi p = 0,56

Nous aimerions utiliser la formule suivante pour calculer l’intervalle de confiance :

Intervalle de confiance = p +/- z*√ p(1-p) / n

où:

  • p : proportion de l’échantillon
  • z : la valeur z qui correspond à la distribution normale
  • n : taille de l’échantillon

Cette formule utilise une valeur z issue de la distribution normale. Ainsi, dans cette formule, nous utilisons la distribution normale pour approximer la distribution binomiale.

Cependant, pour ce faire, nous devons vérifier que la condition de réussite/échec est remplie. Vérifions que le nombre de réussites et le nombre d’échecs dans l’échantillon sont au moins 10 :

Nombre de réussites : np = 100*.56 = 56

Nombre d’échecs : n(1-p) = 100*(1-.56) = 44

Les deux nombres sont égaux ou supérieurs à 10, nous pouvons donc utiliser la formule ci-dessus pour calculer l’intervalle de confiance.

Ressources additionnelles

Une autre condition qui doit être remplie pour utiliser la distribution normale comme approximation de la distribution binomiale est que la taille de l’échantillon avec lequel nous travaillons ne dépasse pas 10 % de la taille de la population. C’est ce qu’on appelle la condition des 10 % .

Gardez également à l’esprit que si vous travaillez avec deux proportions (par exemple en créant un intervalle de confiance pour la différence entre les proportions ), vous devez vérifier que le nombre attendu de réussites et d’échecs dans les deux échantillons est d’au moins 10.

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *