Умова великої вибірки: визначення та приклад
У статистиці ми часто хочемо використовувати вибірки , щоб зробити висновки про сукупності шляхом перевірки гіпотез або довірчих інтервалів .
Більшість формул, які ми використовуємо для перевірки гіпотез і довірчих інтервалів, припускають, що дана вибірка приблизно відповідає нормальному розподілу .
Однак, щоб безпечно сформулювати цю гіпотезу, нам потрібно переконатися, що розмір нашої вибірки є достатньо великим. Зокрема, нам потрібно переконатися, що виконується умова великої вибірки .
Умова великої вибірки: розмір вибірки не менше 30.
Примітка: у деяких підручниках «досить великий» розмір вибірки визначається як щонайменше 40, але частіше використовується число 30.
Коли ця умова виконується, можна вважати, що розподіл вибіркових середніх є приблизно нормальним. Це припущення дозволяє нам використовувати зразки, щоб зробити висновки про сукупності, з яких вони взяті.
Причина, чому використовується число 30, базується на центральній граничній теоремі. Ви можете прочитати більше про це в цій публікації блогу .
Приклад: перевірка статусу великої вибірки
Припустимо, якась машина створює крекери. Розподіл ваги цього печива зміщений вправо із середнім значенням 10 унцій і стандартним відхиленням 2 унції. Якщо ми візьмемо просту випадкову вибірку зі 100 печива, виготовлених цією машиною, яка ймовірність того, що середня вага печива в цій вибірці буде менше 9,8 унцій?
Щоб відповісти на це запитання, ми можемо використати звичайний калькулятор CDF , але спочатку нам потрібно перевірити, чи розмір вибірки достатньо великий, щоб припустити, що розподіл вибіркового середнього є нормальним.
У цьому прикладі розмір нашої вибірки становить n = 100 , що набагато більше, ніж 30. Незважаючи на те, що справжній розподіл ваги файлів cookie зміщений вправо, оскільки розмір нашої вибірки «достатньо великий», ми можемо припустити, що розподіл середнього значення вибірки є нормальним. Тому ми можемо сміливо використовувати звичайний калькулятор CDF для вирішення цієї проблеми.
Зміни стану великих зразків
Часто розмір вибірки вважається «досить великим», якщо він перевищує або дорівнює 30, але це число може дещо відрізнятися залежно від основної форми розподілу населення.
Особливо:
- Якщо розподіл сукупності симетричний, інколи достатньо всього 15 розмірів вибірки.
- Якщо розподіл популяції спотворений, зазвичай необхідна вибірка щонайменше з 30 осіб.
- Якщо розподіл населення надзвичайно спотворений, може знадобитися вибірка з 40 або більше осіб.
Залежно від форми розподілу сукупності вам може знадобитися розмір вибірки більше або менше 30 для застосування центральної граничної теореми.
Додаткові ресурси
Вступ до центральної граничної теореми
Вступ до вибіркових розподілів