Зміщення берксона: визначення + приклади


Зміщення Берксона — це тип зміщення, який виникає в дослідженнях, коли дві змінні здаються негативно корельованими у даних вибірки, але насправді позитивно корелюють у загальній сукупності .

Наприклад, припустімо, що Том хоче вивчити кореляцію між якістю гамбургерів і молочних коктейлів у місцевих ресторанах.

Він виходить і збирає такі дані про сім різних ресторанів:

Він створює точкову діаграму для візуалізації даних:

Приклад парадоксу Берксона

Коефіцієнт кореляції Пірсона між цими двома змінними становить -0,75 , що відповідає сильній негативній кореляції.

Це відкриття суперечить інтуїції Тома: він міг би подумати, що ресторани, де готують хороші гамбургери, також роблять хороші молочні коктейлі.

Однак виявилося, що Том просто проігнорував усі ресторани міста, де готують погані бургери та погані молочні коктейлі.

Якби він відвідав ці ресторани, він зібрав би такий набір даних:

І ось як виглядає діаграма розсіювання для цього набору даних:

Коефіцієнт кореляції Пірсона між двома змінними виявився рівним 0,46 , що являє собою помірно сильну позитивну кореляцію.

Вивчивши лише частину міських ресторанів, Том зробив неправильний висновок про наявність негативної кореляції між якістю гамбургерів і молочних коктейлів.

Насправді виявляється, що між цими двома змінними існує позитивний зв’язок (як і слід було очікувати). Це класичний приклад упередженості Берксона.

Перегляньте наведені нижче приклади для інших сценаріїв, коли зміщення Берксона виникає на практиці.

Приклад 1: вступ до коледжу

Припустімо, що коледж приймає лише студентів, які мають достатньо високий бал GPA та ACT.

Добре відомо, що ці дві змінні позитивно корелюють, але виявилося, що серед студентів, які вирішили вступити до певного коледжу, існує негативна кореляція між ними.

Однак ця негативна кореляція виникає лише тому, що студенти, які мають як високий GPA, так і ACT, можуть навчатися в елітному університеті, тоді як студенти, які мають низький GPA та ACT, не приймаються взагалі.

Хоча кореляція між ACT і GPA позитивна в популяції, кореляція виглядає негативною у вибірці. Це випадок упередженості з боку Берксона.

Приклад 2: Уподобання щодо побачень

Багато людей будуть зустрічатися лише з партнерами, які одночасно привабливі та мають гарний характер.

У реальному світі між цими двома змінними може не бути жодного зв’язку, але при звуженні кола знайомств людина може повністю ігнорувати потенційних партнерів, які одночасно непривабливі та обдаровані. ‘хороша особистість.

Отже, серед потенційних партнерів може здатися, що існує негативна кореляція між цими двома змінними: привабливіші люди мають гірші характери, а люди з кращими характерами здаються менш привабливими.

Упередженість Берксона

Хоча кореляції між цими двома змінними в популяції немає, схоже, що у вибірці потенційних партнерів існує негативна кореляція. Це просто випадок упередженості Берксона.

Як запобігти упередженню Берксона

Найбільш очевидний спосіб уникнути упередженості Берксона в дослідницьких дослідженнях – це зібрати просту випадкову вибірку з сукупності. Іншими словами, переконайтеся, що кожен член досліджуваної сукупності має рівні шанси потрапити до вибірки.

Наприклад, якщо ви вивчаєте поширеність захворювання в певній країні, вам потрібно зібрати вибірку людей з усієї країни, а не лише тих, до кого легко дістатися в лікарнях.

Використовуючи просту випадкову вибірку, дослідники можуть максимізувати ймовірність того, що їх вибірка буде репрезентативною для сукупності, тобто вони можуть впевнено узагальнити свої висновки з вибірки на загальну сукупність.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *