Населення проти зразок: яка різниця?
Часто в статистиці ми хочемо зібрати дані, щоб ми могли відповісти на певні запитання дослідження.
Наприклад, ми можемо захотіти відповісти на такі запитання:
1. Який середній дохід домогосподарства в Маямі, Флорида?
2. Яка середня вага певної популяції черепах?
3. Який відсоток жителів певного округу підтримує певний закон?
У кожному сценарії ми хочемо відповісти на запитання про генеральну сукупність , яка представляє всі можливі окремі елементи, які ми хочемо виміряти.
Однак замість того, щоб збирати дані про кожну людину в популяції, ми збираємо дані про вибірку популяції, яка представляє частину популяції.
Населення : кожен можливий окремий елемент, який ми хочемо виміряти.
Вибірка: частина населення.
Ось приклад сукупності та вибірки у трьох вступних прикладах.
Приклад 1. Який середній дохід домогосподарства в Маямі, Флорида?
Уся сукупність може складатися з 500 000 домогосподарств, але ми можемо зібрати дані лише на вибірці з 2 000 домогосподарств.
2. Яка середня вага певної популяції черепах?
Загальна популяція могла б включати 800 черепах, але ми могли зібрати дані лише про вибірку з 30 черепах.
3. Який відсоток жителів певного округу підтримує певний закон?
Загальна популяція може складати 50 000 осіб, але ми можемо зібрати дані лише на вибірці з 1000 осіб.
Навіщо використовувати зразки?
Є кілька причин, чому ми зазвичай збираємо дані на вибірках, а не на цілих сукупностях, зокрема:
1 . Збір даних про всю сукупність займає надто багато часу . Наприклад, якщо ми хочемо знати середній дохід домогосподарства в Майамі, штат Флорида, можуть знадобитися місяці або навіть роки, щоб зібрати дохід кожного домогосподарства. До того моменту, коли ми збираємо всі ці дані, чисельність населення може змінитися або питання дослідження, яке нас цікавить, може більше не існувати.
2. Надто дорого збирати дані про всю сукупність. Часто збирати дані для кожної особи в популяції занадто дорого, тому ми вирішуємо збирати дані на вибірці.
3. Неможливо зібрати дані про всю сукупність. У багатьох випадках просто неможливо зібрати дані для кожної особини в популяції. Наприклад, може бути надзвичайно важко знайти та зважити кожну черепаху в певній цікавій популяції.
Збираючи дані за зразками, ми можемо збирати інформацію про певну популяцію набагато швидше та з меншими витратами.
І якщо наша вибірка репрезентативна для генеральної сукупності , ми можемо узагальнити результати однієї вибірки на більшу сукупність із високим рівнем достовірності.
Важливість репрезентативних вибірок
Коли ми збираємо вибірку з сукупності, ми в ідеалі хочемо, щоб вибірка нагадувала «міні-версію» нашої сукупності.
Наприклад, скажімо, ми хочемо зрозуміти уподобання учнів у певному шкільному окрузі, де навчається 5000 учнів, у кіно. Оскільки опитування кожного студента окремо зайняло б надто багато часу, замість цього ми могли б взяти вибірку зі 100 студентів і запитати їх про їхні вподобання.
Якщо загальна кількість студентів становить 50% дівчат і 50% хлопців, наша вибірка не була б репрезентативною, якби вона включала 90% хлопців і лише 10% дівчат.
Або якщо загальна сукупність складається з рівних частин першокурсників, другокурсників, молодших і старших курсів, тоді наша вибірка не буде репрезентативною, якби вона включала лише першокурсників.
Вибірка є репрезентативною для сукупності, якщо характеристики індивідів у вибірці точно відповідають характеристикам індивідів у загальній сукупності.
Коли це станеться, ми можемо впевнено узагальнити результати вибірки на загальну сукупність.
Як отримати зразки
Є багато різних методів, які ми можемо використати для отримання вибіркової сукупності.
Щоб максимізувати шанси отримати репрезентативну вибірку, ми можемо використати один із трьох методів:
Проста випадкова вибірка: вибірка осіб випадковим чином за допомогою генератора випадкових чисел або засобів випадкового відбору.
Систематична випадкова вибірка: розмістіть кожного члена сукупності в певному порядку. Виберіть випадкову початкову точку та виберіть одного члена з n, щоб стати частиною вибірки.
Стратифікована випадкова вибірка: поділ сукупності на групи. Навмання виберіть кількох членів із кожної групи, щоб стати частиною вибірки.
У кожному з цих методів кожна особина в сукупності має однакову ймовірність потрапити до вибірки. Це максимізує шанси отримати вибірку, яка є «мініверсією» сукупності.