Une introduction à la distribution hypergéométrique



La distribution hypergéométrique décrit la probabilité de choisir k objets avec une certaine caractéristique dans n tirages sans remplacement, à partir d’une population finie de taille N contenant K objets avec cette caractéristique.

Si une variable aléatoire X suit une distribution hypergéométrique, alors la probabilité de choisir k objets avec une certaine caractéristique peut être trouvée par la formule suivante :

P(X=k) = K C k ( NK C nk ) / N C n

où:

  • N : taille de la population
  • K : nombre d’objets dans la population avec une certaine caractéristique
  • n : taille de l’échantillon
  • k : nombre d’objets dans l’échantillon avec une certaine fonctionnalité
  • K C k : nombre de combinaisons de K choses prises k à la fois

Par exemple, il y a 4 Reines dans un jeu standard de 52 cartes. Supposons que nous choisissions au hasard une carte dans un jeu, puis, sans remplacement, que nous choisissions au hasard une autre carte dans le jeu. Quelle est la probabilité que les deux cartes soient des Reines ?

Pour répondre à cela, nous pouvons utiliser la distribution hypergéométrique avec les paramètres suivants :

  • N : taille de la population = 52 cartes
  • K : nombre d’objets dans la population avec une certaine caractéristique = 4 reines
  • n : taille de l’échantillon = 2 tirages
  • k : nombre d’objets dans l’échantillon avec une certaine caractéristique = 2 reines

En insérant ces nombres dans la formule, nous trouvons que la probabilité est :

P(X=2) = K C k ( NK C nk ) / N C n = 4 C 2 ( 52-4 C 2-2 ) / 52 C 2 = 6*1/ 1326 = 0,00452 .

Cela devrait avoir du sens intuitivement. Si vous vous imaginez tirer deux cartes d’un jeu, l’une après l’autre, la probabilité que les deux cartes soient des Reines devrait être très faible.

Propriétés de la distribution hypergéométrique

La distribution hypergéométrique a les propriétés suivantes :

La moyenne de la distribution est (nK) / N

La variance de la distribution est (nK)(NK)(Nn) / (N 2 (n-1))

Problèmes de pratique de distribution hypergéométrique

Utilisez les problèmes pratiques suivants pour tester vos connaissances sur la distribution hypergéométrique.

Remarque : Nous utiliserons le calculateur de distribution hypergéométrique pour calculer les réponses à ces questions.

Problème 1

Question : Supposons que nous choisissions au hasard quatre cartes dans un jeu sans les remplacer. Quelle est la probabilité que deux des cartes soient des Reines ?

Pour répondre à cela, nous pouvons utiliser la distribution hypergéométrique avec les paramètres suivants :

  • N : taille de la population = 52 cartes
  • K : nombre d’objets dans la population avec une certaine caractéristique = 4 reines
  • n : taille de l’échantillon = 4 tirages
  • k : nombre d’objets dans l’échantillon avec une certaine caractéristique = 2 reines

En branchant ces nombres dans le calculateur de distribution hypergéométrique, nous trouvons que la probabilité est de 0,025 .

Problème 2

Question : Une urne contient 3 boules rouges et 5 boules vertes. Vous choisissez au hasard 4 boules. Quelle est la probabilité que vous choisissiez exactement 2 boules rouges ?

Pour répondre à cela, nous pouvons utiliser la distribution hypergéométrique avec les paramètres suivants :

  • N : taille de la population = 8 boules
  • K : nombre d’objets dans la population avec une certaine caractéristique = 3 boules rouges
  • n : taille de l’échantillon = 4 tirages
  • k : nombre d’objets dans l’échantillon avec une certaine caractéristique = 2 boules rouges

En branchant ces nombres dans le calculateur de distribution hypergéométrique, nous trouvons que la probabilité est de 0,42857 .

Problème 3

Question : Un panier contient 7 billes violettes et 3 billes roses. Vous choisissez au hasard 6 billes. Quelle est la probabilité que vous choisissiez exactement 3 billes roses ?

Pour répondre à cela, nous pouvons utiliser la distribution hypergéométrique avec les paramètres suivants :

  • N : taille de la population = 10 billes
  • K : nombre d’objets dans la population avec une certaine caractéristique = 3 boules roses
  • n : taille de l’échantillon = 6 tirages
  • k : nombre d’objets dans l’échantillon avec une certaine caractéristique = 3 boules roses

En branchant ces nombres dans le calculateur de distribution hypergéométrique, nous trouvons que la probabilité est de 0,16667 .

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *