Умова 10% у статистиці: визначення та приклад
Випробування Бернуллі — це експеримент лише з двома можливими результатами — «успіх» або «невдача», і ймовірність успіху є однаковою кожного разу, коли експеримент проводиться.
Прикладом есе Бернуллі є підкидання монети. Монета може впасти лише на дві голови (ми можемо назвати «орли» «хітом», а решки «невдачею»), а ймовірність успіху при кожному підкиданні становить 0,5, припускаючи, що монета чесна.
Часто в статистиці, коли ми хочемо обчислити ймовірності, що включають більше ніж кілька проб Бернуллі, ми використовуємо нормальний розподіл як наближення. Однак для цього ми повинні припустити, що випробування є незалежними.
У випадках, коли випробування не є дійсно незалежними, ми завжди можемо припустити, що вони є, якщо розмір вибірки, з якою ми працюємо, не перевищує 10% розміру сукупності. Це називається умовою 10% .
Умова 10%: якщо розмір вибірки менший або дорівнює 10% від розміру сукупності, ми завжди можемо вважати, що критерії Бернуллі незалежні.
Інтуїція за умовою 10%.
Щоб розвинути інтуїцію за умовою 10%, розглянемо наступний приклад.
Припустимо, що справжня частка учнів у певному класі, які віддають перевагу футболу, ніж баскетболу, становить 50%. Нехай випадкова змінна X буде кількістю студентів, випадково вибраних у 4 випробуваннях, які віддають перевагу футболу, ніж баскетболу. Припустимо, ми хочемо зрозуміти ймовірність того, що 4 навмання вибраних студенти віддають перевагу футболу, ніж баскетболу.
Якщо розмір нашого класу становить 20 учнів і наші випробування були незалежними (наприклад, ми могли б взяти повторні вибірки всіх 20 учнів), тоді ймовірність того, що кожен учень віддає перевагу футболу, ніж баскетболу, можна розрахувати наступним чином:
P (4 студенти віддають перевагу футболу) = 10/20 * 10/20 * 10/20 * 10/20 = 0,0625 .
Однак, якщо наші випробування не є незалежними (наприклад, коли ми вибираємо учня, його не можна повернути до класу), тоді ймовірність того, що всі 4 учні віддадуть перевагу футболу, буде розрахована таким чином:
P (4 студенти віддають перевагу футболу) = 10/20 * 9/19 * 8/18 * 7/17 = 0,0433 .
Ці дві ймовірності дуже різні. Вважайте, що в цьому прикладі розмір нашої вибірки (4 студенти) не менший або дорівнює 10% сукупності (20 студентів), тому ми не зможемо використати умову 10%.
Проте розглянемо наступну таблицю, яка показує ймовірність того, що 4 випадково вибраних студенти віддадуть перевагу футболу, залежно від розміру класу:
Оскільки розмір вибірки відносно розміру сукупності (наприклад, «розмір класу» у цьому прикладі) зменшується, розрахована ймовірність між незалежними та незалежними дослідженнями стає все ближчою.
Зауважте, що коли розмір вибірки становить рівно 10% від розміру генеральної сукупності, різниця між ймовірностями незалежних випробувань і незалежних випробувань відносно однакова.
А коли розмір вибірки значно менший за 10% від розміру сукупності (наприклад, лише 0,4% від розміру сукупності в останньому рядку таблиці), ймовірності між незалежними та незалежними дослідженнями надзвичайно близькі.
Висновок
Умова 10% стверджує, що розмір нашої вибірки має бути меншим або дорівнювати 10% розміру сукупності, щоб безпечно припустити, що набір досліджень Бернуллі є незалежним.
Звичайно, найкраще, щоб розмір нашої вибірки був значно нижчим за 10% від розміру сукупності, щоб наші висновки щодо сукупності були якомога точними. Наприклад, ми б віддали перевагу тому, щоб наша вибірка становила лише 5% сукупності, а не 10%.
Додаткові ресурси
Введення в нормальний розподіл
Введення в біноміальний розподіл
Вступ до центральної граничної теореми