Співвідношення між розміром вибірки та допустимою похибкою
Часто в статистиці ми хочемо оцінити значення певного параметра сукупності , наприкладчастки чи середнього значення сукупності .
Щоб оцінити ці значення, ми зазвичай збираємо просту випадкову вибірку та обчислюємо частку вибірки або середнє значення вибірки.
Потім ми будуємо довірчий інтервал , щоб охопити нашу невизначеність навколо цих оцінок.
Ми використовуємо наступну формулу для розрахунку довірчого інтервалу для частки населення:
Довірчий інтервал = p ± z*√ p(1-p) / n
золото:
- p: частка зразка
- z: вибране значення z
- n: розмір вибірки
І ми використовуємо таку формулу, щоб обчислити довірчий інтервал для середнього значення сукупності:
Довірчий інтервал = x̄ ± z*(s/√ n )
золото:
- x̄: вибіркове середнє
- z: вибране значення z
- s : вибіркове стандартне відхилення
- n: розмір вибірки
В обох формулах існує зворотна залежність між розміром вибірки та допустимою похибкою.
Чим більший розмір вибірки, тим менша похибка. І навпаки, чим менший розмір вибірки, тим більша похибка.
Перегляньте наступні два приклади, щоб краще це зрозуміти.
Приклад 1: Розмір вибірки та допустима похибка для частки сукупності
Ми використовуємо наступну формулу для розрахунку довірчого інтервалу для частки населення:
Довірчий інтервал = p ± z*√ p(1-p) / n
Частина, виділена червоним, називається похибкою :
Довірчий інтервал = p ± z*√ p(1-p) / n
Зауважте, що в межах похибки ми ділимо на n (розмір вибірки).
Отже, коли розмір вибірки великий, ми ділимо на велике число, що зменшує загальну похибку. Це призводить до вужчого довірчого інтервалу.
Наприклад, припустімо, що ми збираємо просту випадкову вибірку даних із такою інформацією:
- p: 0,6
- n: 25
Ось як розрахувати 95% довірчий інтервал для частки населення:
- Довірчий інтервал = p ± z*√ p(1-p) / n
- Довірчий інтервал = 0,6 ± 1,96*√ 0,6(1-0,6) / 25
- Довірчий інтервал = 0,6 ± 0,192
- Довірчий інтервал = [.408, .792]
Тепер подумайте, чи ми замість цього використовували розмір вибірки 200. Ось як ми обчислюємо 95% довірчий інтервал для частки сукупності:
- Довірчий інтервал = p ± z*√ p(1-p) / n
- Довірчий інтервал = 0,6 ± 1,96*√ 0,6(1-0,6) / 200
- Довірчий інтервал = 0,6 ± 0,068
- Довірчий інтервал = [0,532, 0,668]
Зауважте, що шляхом простого збільшення розміру вибірки ми змогли зменшити межу похибки та отримати набагато вужчий довірчий інтервал.
Приклад 2: Розмір вибірки та допустима похибка для середньої сукупності
Ми використовуємо наступну формулу для розрахунку довірчого інтервалу для середнього значення сукупності:
Довірчий інтервал = x̄ ± z*(s/√ n )
Частина, виділена червоним, називається похибкою :
Довірчий інтервал = x̄ ± z*(s/√ n )
Зауважте, що в межах похибки ми ділимо на n (розмір вибірки).
Отже, коли розмір вибірки великий, ми ділимо на велике число, що зменшує загальну похибку. Це призводить до вужчого довірчого інтервалу.
Наприклад, припустімо, що ми збираємо просту випадкову вибірку даних із такою інформацією:
- x̄: 15
- s : 4
- n: 25
Ось як розрахувати 95% довірчий інтервал для середнього значення сукупності:
- Довірчий інтервал = x̄ ± z*(s/√ n )
- Довірчий інтервал = 15 ± 1,96*(4/√ 25 )
- Довірчий інтервал = 15 ± 1,568
- Довірчий інтервал = [13,432, 16,568]
Тепер подумайте, якби ми замість цього використовували розмір вибірки 200. Ось як ми обчислюємо 95% довірчий інтервал для середнього значення сукупності:
- Довірчий інтервал = x̄ ± z*(s/√ n )
- Довірчий інтервал = 15 ± 1,96*(4/√ 200 )
- Довірчий інтервал = 15 ± 0,554
- Довірчий інтервал = [14,446, 15,554]
Зауважте, що просто збільшивши розмір вибірки, ми змогли зменшити межу похибки та створити більш вузький довірчий інтервал.
Додаткові ресурси
У наступних посібниках надається додаткова інформація про довірчі інтервали для пропорції:
Наступні посібники надають додаткову інформацію про довірчі інтервали для середнього: