Як розрахувати біноміальний довірчий інтервал у python
Довірчий інтервал для біноміальної ймовірності обчислюється за такою формулою:
Довірчий інтервал = p +/- z*(√ p(1-p) / n )
золото:
- p: частка «успіхів»
- z: вибране значення z
- n: розмір вибірки
Найпростіший спосіб обчислити цей тип довірчого інтервалу в Python — скористатися функцією proportion_confint() із пакету statsmodels :
proportion_confint ( count , nobs , alpha = 0.05 , method = ' normal ' )
золото:
- count : кількість успіхів
- nobs : Загальна кількість спроб
- alpha : рівень значущості (за замовчуванням 0,05)
- method : метод для використання для довірчого інтервалу (за замовчуванням «нормальний»)
У наступному прикладі показано, як використовувати цю функцію на практиці.
Приклад: обчислення біноміального довірчого інтервалу в Python
Припустімо, ми хочемо оцінити частку жителів округу, які підтримують певний закон.
Ми вирішили вибрати випадкову вибірку зі 100 мешканців і виявити, що 56 із них підтримують закон.
Ми можемо використати функцію proportion_confint() , щоб обчислити 95% довірчий інтервал для справжньої частки жителів, які мають цей закон у всьому окрузі:
from statsmodels. stats . proportion import proportion_confint #calculate 95% confidence interval with 56 successes in 100 trials proportion_confint(count= 56 , nobs= 100 ) (0.4627099463758483, 0.6572900536241518)
95% довірчий інтервал для справжньої частки жителів округу, які підтримують закон, становить [0,4627, 0,6573] .
За замовчуванням ця функція використовує асимптотичне нормальне наближення для обчислення довірчого інтервалу. Однак ми можемо використовувати аргумент method для використання іншого методу.
Наприклад, функція за замовчуванням, яка використовується в мові програмування R для обчислення біноміального довірчого інтервалу, — це інтервал балів Вільсона.
Ми можемо використовувати такий синтаксис, щоб указати цей метод під час обчислення довірчого інтервалу в Python:
from statsmodels. stats . proportion import proportion_confint #calculate 95% confidence interval with 56 successes in 100 trials proportion_confint(count= 56 , nobs= 100 , method=' wilson ') (0.4622810465167698, 0.6532797336983921)
Це говорить нам про те, що 95% довірчий інтервал для справжньої частки жителів округу, які підтримують закон, становить [0,4623, 0,6533] .
Цей довірчий інтервал дещо відрізняється від обчисленого за допомогою звичайного наближення.
Зауважте, що ми також можемо налаштувати значення альфа , щоб обчислити інший довірчий інтервал.
Наприклад, ми можемо встановити альфа на 0,10, щоб обчислити 90% довірчий інтервал:
from statsmodels. stats . proportion import proportion_confint #calculate 90% confidence interval with 56 successes in 100 trials proportion_confint(count= 56 , nobs= 100 , alpha= 0.10 , method=' wilson ') (0.47783814499647415, 0.6390007285095451)
Це говорить нам про те, що 90% довірчий інтервал для справжньої частки жителів округу, які підтримують закон, становить [0,4778, 0,6390] .
Примітка . Ви можете знайти повну документацію щодо функції proportion_confint() тут .
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові операції в Python:
Як побудувати довірчий інтервал у Python
Як використовувати біноміальний розподіл у Python