Rozkład hipergeometryczny
W tym artykule wyjaśniamy, czym jest rozkład hipergeometryczny i jak oblicza się prawdopodobieństwo dla tego typu rozkładu. W Internecie znajdziesz wzór na rozkład hipergeometryczny, jakie są jego cechy, a także kalkulator pozwalający obliczyć prawdopodobieństwo wystąpienia rozkładu hipergeometrycznego.
Co to jest rozkład hipergeometryczny?
Rozkład hipergeometryczny to rozkład prawdopodobieństwa opisujący liczbę pomyślnych przypadków w losowej ekstrakcji bez zastępowania n elementów z populacji.
Oznacza to, że rozkład hipergeometryczny służy do obliczenia prawdopodobieństwa uzyskania x sukcesów podczas wyodrębniania n elementów z populacji bez zastępowania żadnego z nich.
Rozkład hipergeometryczny ma trzy parametry:
- N : to liczba elementów w populacji (N = 0, 1, 2,…).
- K : to maksymalna liczba przypadków sukcesu (K = 0, 1, 2,…,N). Ponieważ w rozkładzie hipergeometrycznym element można uznać jedynie za „sukces” lub „porażkę”, NK to maksymalna liczba przypadków awarii.
- n : liczba wykonanych pobrań bez zamiany.
Przykładowo dyskretna zmienna losowa X posiadająca rozkład hipergeometryczny o parametrach N=8, K=5 i n=3 jest zdefiniowana następująco:
Wzór na rozkład hipergeometryczny
Wzór na rozkład hipergeometryczny jest iloczynem liczby kombinatorycznej K przez x przez liczbę kombinatoryczną NK przez nx podzieloną przez liczbę kombinatoryczną N przez n .
Gdzie N to wielkość populacji, K to całkowita liczba korzystnych przypadków, n to liczba ekstrakcji bez wymiany, a x to liczba korzystnych przypadków, dla których należy obliczyć prawdopodobieństwo wystąpienia.
👉 Za pomocą poniższego kalkulatora możesz obliczyć prawdopodobieństwo zdarzenia zmiennej zgodnej z rozkładem hipergeometrycznym.
Przykład rozkładu hipergeometrycznego
Kiedy już poznaliśmy definicję i wzór rozkładu hipergeometrycznego, teraz rozwiążemy przykład krok po kroku, abyś wiedział, jak obliczyć prawdopodobieństwo rozkładu hipergeometrycznego.
- Do worka wkładamy 20 kul niebieskich i 30 czerwonych, czyli w sumie w worku znajduje się 50 kulek. Jeśli wylosujemy 12 kul bez zwracania żadnej, znajdź prawdopodobieństwo wylosowania 4 niebieskich kul.
Pierwszą rzeczą, którą musimy zrobić, aby rozwiązać ćwiczenie, jest identyfikacja parametrów rozkładu hipergeometrycznego. W tym przypadku całkowita liczba elementów w populacji wynosi 50 ( N = 50), maksymalna liczba korzystnych przypadków to 20 ( K = 20) i losowanych jest 12 kul ( n = 12).
Chcemy obliczyć prawdopodobieństwo wylosowania 4 niebieskich kul ( x =4), dlatego stosujemy wzór na rozkład hipergeometryczny, zastępujemy zmienne odpowiadającymi im wartościami i wykonujemy obliczenia:
Kalkulator rozkładu hipergeometrycznego
Wprowadź parametry rozkładu hipergeometrycznego do poniższego kalkulatora online, aby obliczyć prawdopodobieństwo wystąpienia pożądanego zdarzenia.
Pamiętaj, że N to wielkość populacji, K to całkowita liczba korzystnych przypadków, n to wielkość próby, a x to wartość, dla której chcemy znaleźć prawdopodobieństwo takiego zdarzenia.
Charakterystyka rozkładu hipergeometrycznego
Rozkład hipergeometryczny ma następujące właściwości:
- Oczekiwana wartość rozkładu hipergeometrycznego jest równa liczbie elementów w próbie pomnożonej przez całkowitą liczbę korzystnych przypadków podzieloną przez liczbę elementów w populacji.
- Tryb rozkładu hipergeometrycznego to wartość zaokrąglona w dół iloczynu n+1 razy K+1 podzielonego przez N+2 .
- Wariancję rozkładu hipergeometrycznego można obliczyć za pomocą następującego wyrażenia:
- Funkcja generująca moment rozkładu hipergeometrycznego jest następująca:
- Charakterystyczna funkcja rozkładu hipergeometrycznego jest następująca:
- Prawdopodobieństwo wystąpienia danej liczby zdarzeń można obliczyć z prawdopodobieństwa liczby poprzedniej, stosując rekurencję dla rozkładu hipergeometrycznego:
Rozkład hipergeometryczny i rozkład dwumianowy
Różnica między rozkładem hipergeometrycznym a rozkładem dwumianowym polega na zastąpieniu. Rozkład hipergeometryczny stosuje się, gdy wyszukiwania nie są zastępowane, natomiast w przypadku rozkładu dwumianowego zastępowane są wyszukiwania.
Na przykład, jeśli losujemy pięć kart w talii i chcemy obliczyć prawdopodobieństwo otrzymania określonej karty, jeśli nie będziemy wymieniać każdej dobieranej karty, do obliczeń musimy użyć rozkładu hipergeometrycznego. Jeśli jednak wyjmując kartę, odłożymy ją z powrotem przed wykonaniem kolejnej ekstrakcji, wówczas do obliczenia prawdopodobieństwa musimy skorzystać z rozkładu dwumianowego.
Gdy liczba N jest duża, stosunek n/N jest mały, a liczba pożądanych korzystnych przypadków jest bardzo mała, możemy zastosować rozkład hipergeometryczny jako przybliżenie rozkładu dwumianowego. Nie polecam jednak tego, gdyż wynik nie będzie tak wiarygodny, a ponadto łatwiej jest obliczyć prawdopodobieństwa z prawa dwumianu niż z prawa hipergeometrycznego.