Що таке умова «склав/не склав» у статистиці?
Випробування Бернуллі — це експеримент лише з двома можливими результатами — «успіх» або «невдача», і ймовірність успіху є однаковою кожного разу, коли експеримент проводиться.
Прикладом есе Бернуллі є підкидання монети. Монета може впасти лише на дві голови (ми можемо назвати орли «ударом», а решка — «провалом»), а ймовірність успіху кожного підкидання становить 0,5, якщо монета чесна.
Часто в статистиці, коли ми хочемо обчислити ймовірності, що включають більше ніж кілька спроб Бернуллі, ми використовуємо нормальний розподіл як наближення. Однак для цього нам потрібно перевірити, чи виконується умова проходження/невиконання :
Умова проходження/невиконання: у вибірці має бути принаймні 10 очікуваних успіхів і 10 очікуваних невдач, щоб використовувати нормальний розподіл як наближення.
Нам потрібно перевірити наступні дві речі:
- Очікувана кількість успіхів становить принаймні 10: np ≥ 10
- Очікувана кількість відмов становить принаймні 10: n(1-p) ≥ 10
де n — розмір вибірки, а p — ймовірність успіху для даного випробування.
Примітка. Натомість у деяких посібниках сказано, що для використання нормального наближення потрібні лише 5 очікуваних успіхів і 5 очікуваних невдач. Однак 10 використовується частіше і є більш консервативним числом. Тому ми будемо використовувати це число в цьому підручнику.
Приклад: Перевірка умови «пройшов/не пройшов».
Припустімо, ми хочемо створити довірчий інтервал для частки жителів округу, які підтримують певний закон. Ми відбираємо випадкову вибірку зі 100 мешканців і запитуємо їхню позицію щодо закону. Ось результати:
- Обсяг вибірки n = 100
- Частка на користь закону р = 0,56
Для розрахунку довірчого інтервалу ми хотіли б використати таку формулу:
Довірчий інтервал = p +/- z*√ p(1-p) / n
золото:
- p: частка зразка
- z: значення z, яке відповідає нормальному розподілу
- n: розмір вибірки
Ця формула використовує значення az із нормального розподілу. Отже, у цій формулі ми використовуємо нормальний розподіл для наближення біноміального розподілу.
Однак для цього нам потрібно перевірити, чи виконується умова «пройшов/не пройшов» . Давайте перевіримо, що кількість успішних і кількість невдач у вибірці не менше 10:
Кількість успіхів: np = 100*.56 = 56
Кількість невдач: n(1-p) = 100*(1-.56) = 44
Обидва числа дорівнюють або перевищують 10, тому ми можемо використати наведену вище формулу для розрахунку довірчого інтервалу.
Додаткові ресурси
Ще одна умова, яка має бути виконана для використання нормального розподілу як наближення до біноміального розподілу, полягає в тому, що розмір вибірки, з якою ми працюємо, не перевищує 10% від розміру сукупності. Це називається умовою 10%.
Також майте на увазі, що якщо ви працюєте з двома пропорціями (наприклад , створюєте довірчий інтервал для різниці між пропорціями ), вам потрібно перевірити, чи очікувана кількість успіхів і невдач у двох вибірках становить принаймні 10.