Центральна гранична теорема: чотири умови, які повинні бути виконані
Центральна гранична теорема стверджує, що вибірковий розподіл вибіркового середнього є приблизно нормальним, якщо розмір вибірки достатньо великий, навіть якщо розподіл сукупності не є нормальним .
Щоб застосувати центральну граничну теорему, мають бути виконані чотири умови:
1. Рандомізація : Дані повинні бути відібрані випадковим чином, щоб кожен член сукупності мав однакову ймовірність бути відібраним для участі у вибірці.
2. Незалежність: значення зразків повинні бути незалежними один від одного.
3. Умова 10%: коли вибірка складається без заміни, розмір вибірки не повинен перевищувати 10% сукупності.
4. Умова великої вибірки: розмір вибірки має бути достатньо великим.
Цей підручник містить коротке пояснення кожної умови.
Умова 1: рандомізація
Щоб застосувати центральну граничну теорему, дані, які ми використовуємо, мають бути випадково відібрані із сукупності за допомогою методу ймовірнісної вибірки .
У статистиці існує два типи методів вибірки :
1. Методи ймовірнісної вибірки: методи вибірки, за яких кожен член генеральної сукупності має однакову ймовірність бути відібраним до складу вибірки. Приклади:
- Проста випадкова вибірка
- Стратифікована випадкова вибірка
- Кластерна випадкова вибірка
- Систематична випадкова вибірка
2. Неімовірнісні методи вибірки: методи вибірки, за яких кожен член генеральної сукупності не має однакової ймовірності бути відібраним до складу вибірки. Приклади:
- Зручний зразок
- Зразок добровільної відповіді
- Сніжок Зразок
- Чиста проба
Для отримання вибірки важливо використовувати метод ймовірнісної вибірки, оскільки це максимізує шанси отримати репрезентативну вибірку сукупності .
Умова 2: Незалежність
Щоб застосувати центральну граничну теорему, ми також повинні припустити, що кожне зі значень у вибірці не залежить одне від одного. Іншими словами, поява однієї події не впливає на появу іншої події.
Це припущення часто задовольняється, якщо ми використовуємо метод імовірнісної вибірки, оскільки ці типи методів вибірки вибирають , які спостереження включити у вибірку абсолютно незалежно одне від одного.
Умова 3: умова 10%.
Коли вибірка складається без заміни (а це майже завжди), розмір вибірки не повинен перевищувати 10% від загальної сукупності.
Наприклад:
- Якщо наша популяція становить 500 осіб, то наша вибірка не повинна перевищувати 50 осіб.
- Якщо наша сукупність становить 1000 осіб, наша вибірка не повинна перевищувати 100 осіб.
- Якщо наша популяція становить 50 000 осіб, то наша вибірка не повинна перевищувати 5 000 осіб.
І так далі.
Умова 4: умова великого зразка
Нарешті, щоб застосувати центральну граничну теорему, розмір нашої вибірки має бути достатньо великим.
Як правило, ми вважаємо «досить великим» 30 або більше. Однак це число може дещо відрізнятися залежно від основної форми розподілу населення.
Особливо:
- Якщо розподіл сукупності симетричний, інколи достатньо всього 15 розмірів вибірки.
- Якщо розподіл популяції спотворений, зазвичай необхідна вибірка щонайменше з 30 осіб.
- Якщо розподіл населення надзвичайно спотворений, може знадобитися вибірка з 40 або більше осіб.
Залежно від форми розподілу сукупності вам може знадобитися розмір вибірки більше або менше 30 для застосування центральної граничної теореми.