Введення в гіпергеометричний розподіл
Гіпергеометричний розподіл описує ймовірність вибору k об’єктів з певною характеристикою в n розіграшах без заміни з кінцевої сукупності розміром N , що містить K об’єктів із цією характеристикою.
Якщо випадкова величина X відповідає гіпергеометричному розподілу, то ймовірність вибору k об’єктів з певною характеристикою можна знайти за такою формулою:
P(X=k) = K C k ( NK C nk ) / N C n
золото:
- N: розмір популяції
- K: кількість об’єктів у сукупності з певною ознакою
- n: розмір вибірки
- k: кількість об’єктів у вибірці з певною функціональністю
- K C k : кількість комбінацій із K речей, взятих k за раз
Наприклад, у стандартній колоді з 52 карт є 4 дами. Припустімо, ми навмання вибираємо карту з колоди, а потім, не замінюючи, навмання вибираємо іншу карту з колоди. Яка ймовірність того, що обидві карти є дамами?
Щоб відповісти на це питання, ми можемо використати гіпергеометричний розподіл із такими параметрами:
- N: розмір населення = 52 картки
- K: кількість об’єктів у популяції з певною ознакою = 4 матки
- n: розмір вибірки = 2 розіграші
- k: кількість об’єктів у вибірці з певною ознакою = 2 матки
Підставляючи ці числа у формулу, ми знаходимо, що ймовірність:
P(X=2) = K C k ( NK C nk ) / N C n = 4 C 2 ( 52-4 C 2-2 ) / 52 C 2 = 6*1/ 1326 = 0,00452 .
Це має бути інтуїтивно зрозумілим. Якщо ви уявляєте, що витягуєте дві карти з колоди одну за одною, ймовірність того, що обидві карти є дамами, має бути дуже низькою.
Властивості гіпергеометричного розподілу
Гіпергеометричний розподіл має такі властивості:
Середнє значення розподілу дорівнює (nK) / N
Дисперсія розподілу становить (nK)(NK)(Nn) / (N 2 (n-1))
Практичні задачі гіпергеометричного розподілу
Використовуйте наведені нижче практичні завдання, щоб перевірити свої знання про гіпергеометричний розподіл.
Примітка: ми будемо використовувати калькулятор гіпергеометричного розподілу , щоб обчислити відповіді на ці запитання.
Проблема 1
Запитання: Припустімо, ми навмання вибираємо чотири карти з колоди, не замінюючи їх. Яка ймовірність того, що дві з карт є дамами?
Щоб відповісти на це питання, ми можемо використати гіпергеометричний розподіл із такими параметрами:
- N: розмір населення = 52 картки
- K: кількість об’єктів у популяції з певною ознакою = 4 матки
- n: розмір вибірки = 4 розіграші
- k: кількість об’єктів у вибірці з певною ознакою = 2 матки
Вставивши ці числа в калькулятор гіпергеометричного розподілу, ми виявимо, що ймовірність дорівнює 0,025 .
Проблема 2
Запитання: Урна містить 3 червоні кулі та 5 зелених куль. Ви навмання обираєте 4 кулі. Яка ймовірність того, що ви виберете саме 2 червоні кулі?
Щоб відповісти на це питання, ми можемо використати гіпергеометричний розподіл із такими параметрами:
- N: розмір населення = 8 кульок
- K: кількість об’єктів у сукупності з певною ознакою = 3 червоні кульки
- n: розмір вибірки = 4 розіграші
- k: кількість об’єктів у вибірці з певною ознакою = 2 червоні кульки
Вставивши ці числа в калькулятор гіпергеометричного розподілу, ми виявимо, що ймовірність дорівнює 0,42857 .
Проблема 3
Запитання: кошик містить 7 фіолетових кульок і 3 рожевих кульки. Ви випадковим чином обираєте 6 кульок. Яка ймовірність того, що ви виберете саме 3 рожеві кульки?
Щоб відповісти на це питання, ми можемо використати гіпергеометричний розподіл із такими параметрами:
- N: розмір населення = 10 кульок
- K: кількість об’єктів у сукупності з певною ознакою = 3 рожеві кульки
- n: розмір вибірки = 6 розіграшів
- k: кількість об’єктів у вибірці з певною ознакою = 3 рожеві кульки
Вставивши ці числа в калькулятор гіпергеометричного розподілу, ми виявимо, що ймовірність дорівнює 0,16667 .