Размер образца
В этой статье объясняется, что такое размер выборки и почему он важен в статистике. Кроме того, вы узнаете, как рассчитать соответствующий размер выборки, и решите упражнение, чтобы увидеть, как это делается.
Каков размер выборки?
Размер выборки (или размер выборки ) — это количество людей, составляющих выборку исследования. В статистике важен размер выборки, чтобы выборка была репрезентативной для всей совокупности.
Следовательно, размер выборки статистического исследования должен быть достаточно большим, чтобы отражать характеристики всей совокупности. С другой стороны, размер выборки не может быть чрезмерно большим, поскольку в этом случае исследование становится более дорогим. В заключение следует отметить, что размер выборки должен быть адекватным, не слишком большим и не слишком маленьким.
Например, если мы хотим провести анализ высоты страны, мы не можем запросить рост всех жителей страны, потому что опрос займет много времени и будет слишком дорогим. Поэтому необходимо провести случайную выборку и опросить только репрезентативную выборку населения.
И как мы можем узнать подходящий размер выборки? В следующем разделе мы увидим, как определить подходящий размер выборки на основе требований исследования.
Как рассчитать размер выборки
Для оценки среднего требуемый размер выборки равен квадрату Z α/2 , умноженному на стандартное отклонение (σ), деленное на желаемую погрешность (e). Таким образом , формула для расчета размера выборки выглядит следующим образом:
Золото:
-
это размер выборки.
-
желаемый уровень значимости. Принимая во внимание это
желаемый уровень доверия.
-
— квантиль стандартного нормального распределения, соответствующий вероятности α/2. Для больших размеров выборки и уровня достоверности 95% оно обычно близко к 1,96, а для уровня достоверности 99% оно обычно близко к 2,576.
-
является стандартным отклонением.
Имейте в виду, что в этой формуле предполагается, что размер популяции бесконечен, то есть размер популяции очень велик или неизвестен.
Примечание. Приведенная выше формула получена на основе интервала доверительной формулы для среднего значения .
Пример расчета размера выборки
В этом разделе в качестве примера мы рассчитаем соответствующий размер выборки для статистического обследования.
- Мы знаем, что стандартное отклонение популяции составляет около 15, но мы не знаем его среднего значения, поэтому мы хотим провести исследование, чтобы оценить среднее значение. Какой размер выборки нам нужен, если мы хотим, чтобы погрешность составляла ±2 с уровнем достоверности 95%?
Как мы видели выше, формула для расчета размера выборки:
В этом случае желаемый уровень достоверности составляет 95%, поэтому соответствующее значение Z α/2 равно 1,96.
Наконец, теперь, когда мы знаем, сколько стоят все параметры, подставляем их значения в формулу и вычисляем размер выборки:
Короче говоря, чтобы оценить среднее значение популяции с желаемыми требованиями, нам нужна выборка как минимум из 217 человек.
Размер выборки, уровень достоверности и погрешность
В зависимости от уровня достоверности и требуемой погрешности требуемый размер выборки будет варьироваться. Таким образом, размер выборки, уровень достоверности и погрешность связаны следующим образом:
- Размер выборки и уровень достоверности прямо пропорциональны. То есть, если уровень достоверности увеличится, размер выборки также увеличится.
- Размер выборки и погрешность обратно пропорциональны. Таким образом, если погрешность увеличится, размер выборки уменьшится.
- Следовательно, увеличение размера выборки может повысить уровень достоверности или уменьшить погрешность.
Другие формулы размера выборки
В зависимости от оцениваемого параметра формула необходимого размера выборки незначительно меняется. Поэтому в этом разделе мы увидим другие формулы, которые могут быть полезны для расчета размера выборки в некоторых особых случаях.
размер выборки доли
Формула для расчета размера выборки, необходимой для оценки доли (p):
Размер выборки вероятности
Если вы хотите оценить вероятность, рекомендуется использовать следующую формулу для определения необходимого размера выборки:
Размер выборки для сравнения двух независимых средних значений
Формула расчета размера выборки при сравнении двух независимых средних значений с заданным риском α и риском β выглядит следующим образом:
Золото
это разница между двумя средствами альтернативной гипотезы.
Размер выборки для сравнения двух парных средних значений
Если вы хотите сравнить два парных средних значения с фиксированной ошибкой α и ошибкой β, для определения количества наблюдений в выборке следует использовать следующую формулу:
Золото
это разница между двумя парными средними альтернативной гипотезы и
Это дисперсия различий между двумя измерениями одного и того же человека.