Що таке репрезентативна вибірка і чому вона важлива?


У статистиці ми часто зацікавлені у вивченні характеристик конкретних груп населення. Наприклад, нам може бути цікаво вивчити:

  • Загальна задоволеність роботою інженерів-механіків у певному місті.
  • Політичні уподобання окремих осіб у певному окрузі.
  • Віковий розподіл людей у певній країні.
  • Кінематографічні уподобання учнів певної школи.

У кожному з цих прикладів ми хочемо краще зрозуміти певну групу населення .

Популяція: уся група осіб, яку ви бажаєте вивчити.

На жаль, збір даних про кожну особину в популяції може бути дорогим і трудомістким. Ось чому дослідники зазвичай збирають дані на вибірці сукупності, а потім узагальнюють результати вибірки на всю сукупність.

Вибірка: підмножина сукупності.

Наприклад, скажімо, ми хочемо зрозуміти, які уподобання у фільмах мають учні певної школи, де загалом навчається 1000 учнів. Оскільки опитування кожного студента окремо займе надто багато часу, замість цього ми могли б взяти випадкову вибірку зі 100 студентів і запитати їх про їхні вподобання.

1000 студентів представляють сукупність, тоді як 100 випадково відібраних студентів представляють вибірку. Після того як ми зібрали дані для вибірки зі 100 студентів, ми можемо узагальнити ці результати на загальну сукупність із 1000 студентів, але лише якщо наша вибірка є репрезентативною для нашої сукупності .

Репрезентативна вибірка: вибірка, в якій характеристики індивідуумів точно відповідають характеристикам загальної сукупності.

В ідеалі ми хочемо, щоб наша вибірка нагадувала «міні-версію» нашої сукупності. Таким чином, якщо загальна кількість студентів складається з 50% дівчат і 50% хлопців, наша вибірка не буде репрезентативною, якщо вона включатиме 90% хлопців і лише 10% дівчат.

Приклад вибірки, яка не є репрезентативною для сукупності

Або, якщо загальна сукупність складається з рівних частин першокурсників, другокурсників, молодших і старших студентів, тоді наша вибірка не була б репрезентативною, якби вона включала лише першокурсників.

Вибірка, яка не є репрезентативною для сукупності

Важливість отримання репрезентативної вибірки

Причина, по якій нам потрібна репрезентативна вибірка, полягає в тому, щоб ми могли впевнено узагальнити результати вибірки на сукупність.

Наприклад, скажімо, ми хочемо знати, який відсоток учнів у певній школі віддає перевагу «драмі» як своєму улюбленому жанру фільму. Якщо загальна кількість студентів складається з 50% хлопців і 50% дівчат, тоді вибірка, що складається з 90% хлопців і 10% дівчат, може призвести до необ’єктивних результатів, якщо значно менше хлопців віддають перевагу театру як улюбленому жанру.

Або, якщо загальна сукупність складається з рівної суміші першокурсників, другокурсників, молодших і старших курсів, тоді вибірка, що включає лише першокурсників, також може призвести до необ’єктивних результатів, якщо молодші студенти (наприклад, першокурсники) схильні віддавати перевагу театру з набагато вищими показниками, ніж першокурсники. старші учні.

Якщо характеристики індивідів у нашій вибірці не відповідають характеристикам індивідів у загальній сукупності, тоді ми не можемо впевнено узагальнити результати вибірки на загальну сукупність.

Як отримати репрезентативну вибірку

Щоб максимізувати шанси отримати репрезентативну вибірку, ми повинні зосередитися на двох речах під час отримання нашої вибірки:

1. Використовуйте відповідний метод відбору проб.

Є багато способів отримати вибірку генеральної сукупності , але ось три методи, за допомогою яких можна отримати репрезентативну вибірку:

Проста випадкова вибірка: виберіть осіб випадковим чином за допомогою генератора випадкових чисел або засобів випадкового відбору.

  • Приклад: присвоїти число 1000 студентам. Потім скористайтеся генератором випадкових чисел, щоб вибрати 100 випадкових чисел і використати відповідних студентів як учасників вибірки.
  • Перевага: прості випадкові вибірки, як правило, є репрезентативними для досліджуваної сукупності, оскільки кожен учасник має рівні шанси потрапити до вибірки.

Систематична випадкова вибірка: розмістіть кожного члена сукупності в певному порядку. Виберіть випадкову початкову точку та виберіть одного члена з n, щоб стати частиною вибірки.

  • Приклад: створіть алфавітний список на основі прізвищ усіх 1000 студентів, випадковим чином оберіть початкову точку та виберіть кожного десятого студента для вибірки.
  • Перевага: систематичні випадкові вибірки, як правило, є репрезентативними для досліджуваної сукупності, оскільки кожен член має рівні шанси бути включеним до вибірки.

Стратифікована випадкова вибірка: розділіть сукупність на групи. Навмання виберіть кількох членів із кожної групи, щоб стати частиною вибірки.

  • Приклад: розділіть усіх студентів відповідно до їх рівня: першокурсники, другокурсники, молодші та старші. Випадково оберіть 25 учнів з кожного класу, щоб стати частиною вибірки.
  • Перевага: стратифіковані випадкові вибірки гарантують, що до вибірки входить однакова кількість учнів з кожного класу.

2. Переконайтеся, що зразок достатньо великий.

Окрім використання відповідного методу вибірки, важливо переконатися, що вибірка є достатньо великою, щоб у нас було достатньо даних для узагальнення на більшу сукупність.

Наприклад, вибірка з восьми учнів – одного хлопця та однієї дівчини з кожного класу – може представляти міні-версію генеральної сукупності в цілому, але вона, ймовірно, недостатньо велика, щоб охопити всю мінливість, яка природно існує у відповідях учнів. .

Отже, наскільки великою має бути ваша вибірка?

Це залежить від таких факторів:

  • Розмір сукупності: загалом, чим більший розмір сукупності, тим більшою має бути вибірка. Наприклад, вам знадобиться набагато більша вибірка, якщо ви хочете узагальнити свої результати на всю країну, а не на одне місто.
  • Рівень довіри. Наскільки ви хочете бути впевнені, що справжня вартість сукупності, яка вас цікавить, знаходиться в межах вашого довірчого інтервалу. Загальні рівні достовірності включають 90%, 95% і 99%. Чим вищий рівень достовірності, тим більшою повинна бути ваша вибірка.
  • Похибка: скільки помилок ви готові допустити. Жоден зразок не буде ідеальним, тому ви повинні бути готові прийняти принаймні деяку кількість помилок. Більшість досліджень повідомляють про свої результати з похибкою, наприклад, «40% студентів сказали, що театр є їхнім улюбленим жанром кіно, з похибкою +/- 5%». » Чим менша похибка, тим меншою має бути ваша вибірка.

В Інтернеті є багато калькуляторів розміру вибірки, які допоможуть визначити розмір вибірки на основі цих факторів. Цей калькулятор від Survey Monkey особливо простий у використанні.

Речі, про які слід пам’ятати

Навіть якщо ви використовуєте належний метод відбору та переконаєтеся, що вибірка достатньо велика, майте на увазі таке:

  • Завжди буде помилка вибірки. Вибірка ніколи не буде ідеально репрезентативною для сукупності в цілому.
  • Загалом, чим більша вибірка, тим репрезентативнішою вона є для сукупності.
  • Вам потрібно збалансувати розмір вибірки з такими реальними змінними, як час і вартість. Більша вибірка може з більшою ймовірністю представляти загальну сукупність, але її отримання може бути дорожчим і трудомістким.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *