Центральная предельная теорема: четыре условия, которые необходимо выполнить
Центральная предельная теорема утверждает, что выборочное распределение выборочного среднего примерно нормально, если размер выборки достаточно велик, даже если распределение совокупности не является нормальным .
Для применения центральной предельной теоремы необходимо выполнение четырех условий:
1. Рандомизация : данные должны отбираться случайным образом, чтобы каждый член совокупности имел равную вероятность быть выбранным для включения в выборку.
2. Независимость: значения выборок должны быть независимы друг от друга.
3. Условие 10%: при составлении выборки без замещения размер выборки не должен превышать 10% генеральной совокупности.
4. Условия большой выборки: Размер выборки должен быть достаточно большим.
В этом руководстве представлено краткое объяснение каждого условия.
Условие 1: рандомизация
Чтобы применить центральную предельную теорему, используемые нами данные должны быть случайным образом отобраны из совокупности с использованием метода вероятностной выборки .
В статистике существует два типа методов выборки :
1. Методы вероятностной выборки: методы выборки, при которых каждый член совокупности имеет равную вероятность быть выбранным для включения в выборку. Примеры включают в себя:
- Простая случайная выборка
- Стратифицированная случайная выборка
- Кластеризованная случайная выборка
- Систематическая случайная выборка
2. Невероятностные методы выборки: методы выборки, при которых каждый член генеральной совокупности не имеет одинаковой вероятности быть выбранным для включения в выборку. Примеры включают в себя:
- Образец удобства
- Образец добровольного ответа
- Образец снежка
- Чистый образец
Для получения выборки важно использовать метод вероятностной выборки, поскольку это максимизирует шансы на получение репрезентативной выборки генеральной совокупности .
Условие 2: Независимость
Чтобы применить центральную предельную теорему, мы должны также предположить, что каждое из значений в выборке не зависит друг от друга. Другими словами, возникновение одного события не влияет на возникновение другого события.
Это предположение часто удовлетворяется, если мы используем метод вероятностной выборки, поскольку эти типы методов выборки выбирают , какие наблюдения включать в выборку, совершенно независимо друг от друга.
Условие 3: условие 10%
Когда выборка формируется без замещения (что происходит почти всегда), размер выборки не должен превышать 10% от общей численности генеральной совокупности.
Например:
- Если численность нашей популяции составляет 500 человек, то размер выборки не должен превышать 50 человек.
- Если численность нашей популяции составляет 1000 человек, наша выборка не должна превышать 100 человек.
- Если численность нашей популяции составляет 50 000 человек, то размер нашей выборки не должен превышать 5 000 человек.
И так далее.
Условие 4: Состояние большой выборки
Наконец, чтобы применить центральную предельную теорему, размер нашей выборки должен быть достаточно большим.
Обычно мы считаем «достаточно большим» число 30 и более. Однако это число может незначительно варьироваться в зависимости от основной формы распределения населения.
Особенно:
- Если распределение населения симметрично, иногда достаточно небольшого размера выборки, составляющего 15 человек.
- Если распределение населения неравномерное, обычно необходима выборка размером не менее 30 человек.
- Если распределение населения крайне неравномерно, может потребоваться выборка из 40 и более человек.
В зависимости от формы распределения населения вам может потребоваться размер выборки больше или меньше 30, чтобы применить центральную предельную теорему.