Население против. образец: в чем разница?
Часто в статистике мы хотим собрать данные, чтобы ответить на определенные исследовательские вопросы.
Например, мы можем захотеть ответить на следующие вопросы:
1. Каков средний доход семьи в Майами, Флорида?
2. Каков средний вес черепах определенной популяции?
3. Какой процент жителей определенного округа поддерживает тот или иной закон?
В каждом сценарии мы хотим ответить на вопрос о совокупности , которая представляет все возможные отдельные элементы, которые мы хотим измерить.
Однако вместо сбора данных о каждом человеке в популяции мы собираем данные о выборке населения, которая представляет собой часть населения.
Население : каждый возможный отдельный элемент, который мы хотим измерить.
Выборка: Часть населения.
Вот пример совокупности и выборки в трех вводных примерах.
Пример 1. Каков средний доход семьи в Майами, Флорида?
Все население может состоять из 500 000 домохозяйств, но мы можем собрать данные только по выборке из 2000 домохозяйств.
2. Каков средний вес черепах определенной популяции?
Общая популяция могла бы включать 800 черепах, но мы смогли собрать данные только по выборке из 30 черепах.
3. Какой процент жителей определенного округа поддерживает тот или иной закон?
Общая численность населения может составлять 50 000 человек, но мы можем собрать данные только по выборке из 1000 человек.
Зачем использовать образцы?
Существует несколько причин, по которым мы обычно собираем данные по выборкам, а не по всей совокупности, в том числе:
1 . Сбор данных обо всем населении занимает слишком много времени . Например, если мы хотим узнать средний доход домохозяйства в Майами, штат Флорида, сбор доходов каждого домохозяйства может занять месяцы или даже годы. К тому времени, когда мы соберем все эти данные, популяция может измениться или интересующий нас исследовательский вопрос может исчезнуть.
2. Собирать данные обо всем населении слишком дорого. Часто собирать данные по каждому индивидууму в популяции бывает слишком дорого, поэтому вместо этого мы предпочитаем собирать данные по выборке.
3. Невозможно собрать данные обо всем населении. Во многих случаях просто невозможно собрать данные по каждому человеку в популяции. Например, может быть чрезвычайно сложно найти и взвесить каждую черепаху в определенной интересующей популяции.
Собирая данные по выборкам, мы можем собрать информацию о данной популяции гораздо быстрее и с меньшими затратами.
И если наша выборка является репрезентативной для населения , то мы можем обобщить результаты одной выборки на более крупную совокупность с высоким уровнем достоверности.
Важность репрезентативных выборок
Когда мы собираем выборку из популяции, в идеале мы хотим, чтобы выборка напоминала «мини-версию» нашей популяции.
Например, предположим, что мы хотим понять предпочтения в кино учащихся определенного школьного округа с общим числом учащихся 5000 человек. Поскольку опрос каждого студента в отдельности занял бы слишком много времени, вместо этого мы могли бы взять выборку из 100 студентов и спросить их об их предпочтениях.
Если в общей численности учащихся 50% девочек и 50% мальчиков, наша выборка не была бы репрезентативной, если бы она включала 90% мальчиков и только 10% девочек.
Или, если общая численность населения состоит из равных частей первокурсников, второкурсников, младших и старших классов, тогда наша выборка не была бы репрезентативной, если бы она включала только первокурсников.
Выборка является репрезентативной для совокупности, если характеристики индивидов в выборке близко соответствуют характеристикам особей в генеральной совокупности.
Когда это произойдет, мы сможем с уверенностью обобщить результаты выборки на всю совокупность.
Как получить образцы
Существует множество различных методов, которые мы можем использовать для получения выборочных совокупностей.
Чтобы максимизировать вероятность получения репрезентативной выборки, мы можем использовать один из трех методов:
Простая случайная выборка: случайный выбор людей с помощью генератора случайных чисел или средств случайного отбора.
Систематическая случайная выборка: расположите каждого члена популяции в определенном порядке. Выберите случайную отправную точку и выберите одного участника из n, который станет частью выборки.
Стратифицированная случайная выборка: деление совокупности на группы. Случайным образом выберите несколько членов из каждой группы, чтобы они вошли в выборку.
В каждом из этих методов каждый человек в популяции имеет равную вероятность быть включенным в выборку. Это максимизирует шансы получить выборку, которая представляет собой «мини-версию» генеральной совокупности.