Een inleiding tot de hypergeometrische distributie
De hypergeometrische verdeling beschrijft de waarschijnlijkheid dat k objecten met een bepaald kenmerk worden gekozen in n trekkingen zonder vervanging, uit een eindige populatie van grootte N die K objecten met dit kenmerk bevat.
Als een willekeurige variabele X een hypergeometrische verdeling volgt, kan de kans op het kiezen van k objecten met een bepaald kenmerk worden gevonden met de volgende formule:
P(X=k) = K C k ( NK C nk ) / N C n
Goud:
- N: populatieomvang
- K: aantal objecten in de populatie met een bepaald kenmerk
- n: steekproefomvang
- k: aantal objecten in het monster met een bepaalde functionaliteit
- K C k : aantal combinaties van K dingen die k tegelijk worden genomen
Er zitten bijvoorbeeld 4 Koninginnen in een standaard kaartspel van 52 kaarten. Stel dat we willekeurig een kaart uit een stapel kiezen en vervolgens, zonder vervanging, willekeurig een andere kaart uit de stapel kiezen. Wat is de kans dat beide kaarten koninginnen zijn?
Om dit te beantwoorden kunnen we de hypergeometrische verdeling gebruiken met de volgende parameters:
- N: populatiegrootte = 52 kaarten
- K: aantal objecten in de populatie met een bepaald kenmerk = 4 koninginnen
- n: steekproefomvang = 2 trekkingen
- k: aantal objecten in de steekproef met een bepaald kenmerk = 2 koninginnen
Als we deze getallen in de formule stoppen, ontdekken we dat de waarschijnlijkheid:
P(X=2) = K C k ( NK C nk ) / N C n = 4 C 2 ( 52-4 C 2-2 ) / 52 C 2 = 6*1/ 1326 = 0,00452 .
Dit zou intuïtief logisch moeten zijn. Als je je voorstelt dat je twee kaarten uit een stapel trekt, de een na de ander, dan zou de kans dat beide kaarten Koninginnen zijn erg laag moeten zijn.
Eigenschappen van hypergeometrische distributie
De hypergeometrische verdeling heeft de volgende eigenschappen:
Het gemiddelde van de verdeling is (nK) / N
De variantie van de verdeling is (nK)(NK)(Nn) / (N 2 (n-1))
Oefenproblemen met hypergeometrische distributie
Gebruik de volgende oefenproblemen om uw kennis van de hypergeometrische verdeling te testen.
Opmerking: we zullen de Hypergeometrische Verdelingscalculator gebruiken om de antwoorden op deze vragen te berekenen.
Probleem 1
Vraag: Stel dat we willekeurig vier kaarten uit een kaartspel kiezen zonder ze te vervangen. Wat is de kans dat twee van de kaarten koninginnen zijn?
Om dit te beantwoorden kunnen we de hypergeometrische verdeling gebruiken met de volgende parameters:
- N: populatiegrootte = 52 kaarten
- K: aantal objecten in de populatie met een bepaald kenmerk = 4 koninginnen
- n: steekproefomvang = 4 trekkingen
- k: aantal objecten in de steekproef met een bepaald kenmerk = 2 koninginnen
Als we deze getallen in de hypergeometrische verdelingscalculator pluggen, ontdekken we dat de waarschijnlijkheid 0,025 is.
Probleem 2
Vraag: In een urn zitten 3 rode ballen en 5 groene ballen. Je kiest willekeurig 4 ballen. Hoe groot is de kans dat je precies 2 rode ballen kiest?
Om dit te beantwoorden kunnen we de hypergeometrische verdeling gebruiken met de volgende parameters:
- N: populatiegrootte = 8 ballen
- K: aantal objecten in de populatie met een bepaald kenmerk = 3 rode bollen
- n: steekproefomvang = 4 trekkingen
- k: aantal objecten in het monster met een bepaald kenmerk = 2 rode ballen
Als we deze getallen in de hypergeometrische verdelingscalculator pluggen, ontdekken we dat de waarschijnlijkheid 0,42857 is.
Probleem 3
Vraag: In een mandje zitten 7 paarse knikkers en 3 roze knikkers. Je kiest willekeurig 6 knikkers. Hoe groot is de kans dat je precies 3 roze knikkers kiest?
Om dit te beantwoorden kunnen we de hypergeometrische verdeling gebruiken met de volgende parameters:
- N: populatiegrootte = 10 knikkers
- K: aantal objecten in de populatie met een bepaald kenmerk = 3 roze ballen
- n: steekproefomvang = 6 trekkingen
- k: aantal objecten in het monster met een bepaald kenmerk = 3 roze ballen
Als we deze getallen in de hypergeometrische verdelingscalculator pluggen, ontdekken we dat de waarschijnlijkheid 0,16667 is.