Смещение занижения счета: объяснение и примеры
Систематическая ошибка недостаточного подсчета — это систематическая ошибка, которая возникает, когда некоторые члены совокупности недостаточно представлены в выборке.
Этот тип систематической ошибки часто возникает при выборке по принципу удобства и выборке добровольных ответов , когда вы собираете выборку, которую легко получить, но в которой часто занижаются некоторые члены совокупности.
Почему смещение занижения является проблемой?
Смещение занижения подсчета является проблемой, поскольку оно приводит к тому, что выборка не является репрезентативной для населения. Целью сбора данных для выборки является получение данных более быстрым и простым способом, чем сбор данных для всей совокупности, а также возможность экстраполировать результаты выборки на более крупную совокупность. широкий.
Однако для экстраполяции результатов выборка должна быть репрезентативной для нашей популяции в целом. В идеале мы хотели бы, чтобы наша выборка представляла собой «мини-версию» генеральной совокупности. К сожалению, из-за систематической ошибки недостаточного учета люди в нашей выборке могут сильно отличаться от представителей более широкой популяции.
Например, предположим, что исследователи хотят знать, что думают жители определенного города о потенциальном новом законе. Чтобы собрать данные, они идут в ближайшую библиотеку и спрашивают посетителей, что они думают о потенциальном новом законе. Хотя это удобный способ сбора данных, исследователи рискуют недооценить несколько типов людей, в том числе:
- Люди, запертые дома
- Люди, которые просто не любят ходить в библиотеку
- Люди, которые ходят в другую библиотеку в другой части города
Поскольку это исследование исключает определенные типы людей, результаты исследования вряд ли будут репрезентативными для населения.
Например, предположим, что люди, посещающие эту конкретную библиотеку, с гораздо большей вероятностью поддержат потенциальный новый закон, чем остальная часть населения. Это означает, что когда станут известны результаты опроса, окажется, что высокий процент граждан в этом городе поддерживают потенциальный новый закон, хотя на самом деле большинство граждан этого не делают.
На рисунке ниже показана эта проблема: предположим, что зеленые круги представляют людей, поддерживающих новый закон, а красные круги представляют людей, выступающих против нового закона:
Обратите внимание, что в выборку включено большинство сторонников нового закона, но она не является репрезентативной для населения в целом. Результаты опроса, как сообщается, показывают, что большинство людей поддерживают новый закон, хотя на самом деле это не так.
Примеры систематической ошибки занижения учета
Следующие примеры иллюстрируют несколько случаев, в которых может возникнуть систематическая ошибка занижения.
Пример 1
Исследователи хотят знать, что думают жители определенного города о строительстве нового парка. Чтобы собрать данные, исследователи посещают местное городское собрание и спрашивают жителей, что они думают. К сожалению, эта форма удобной выборки может пострадать из-за недоучета следующих групп:
- Люди, у которых нет доступа к транспорту, чтобы добраться на муниципальные собрания
- Люди, которые даже не знают, что проходят городские собрания
- Люди, которые работают по вечерам и просто не могут посещать городские собрания.
Поэтому мнения этих людей не будут учитываться в результатах исследования. Из-за недостаточного учета этих конкретных групп выборка вряд ли будет репрезентативной для населения в целом.
Пример 2
Исследователи хотят знать, сколько часов в день люди смотрят телевизор в той или иной стране. Чтобы собрать данные для исследования, они случайным образом выбирают имена из местного телефонного справочника и звонят людям, чтобы спросить их об их телевизионном потреблении. Это форма удобной выборки, и она может пострадать из-за занижения следующих групп:
- Очень богатые люди, не указывающие свои номера телефонов в местных телефонных справочниках.
- Молодые люди, которые пользуются только мобильными телефонами, номера которых не указаны в местных телефонных справочниках.
Таким образом, количество телевидения, которое смотрят очень богатые люди и молодые люди, в данном исследовании будет недооценено. Из-за недостаточного учета этих конкретных групп выборка вряд ли будет репрезентативной для населения в целом.
Пример 3
Исследователи хотят знать, что думают жители конкретного города о новом ПДД. Поэтому они раздают анкеты людям, которые проходят через местный торговый центр. Это форма удобной выборки, которая может пострадать из-за недостаточного охвата следующих групп:
- Люди, у которых нет доступа к транспорту, чтобы добраться до торгового центра (и поэтому на них практически не влияют правила дорожного движения)
- Люди, которые не любят ходить в торговые центры (и поэтому могут предпочесть не ездить в оживленные районы)
- Люди идут в другой торговый центр в другом городе
Поэтому мнения этих людей не будут учитываться в результатах исследования. Из-за недостаточного учета этих конкретных групп выборка вряд ли будет репрезентативной для населения в целом.
Как предотвратить смещение занижения
Смещение занижения часто является результатом удобной выборки. Чтобы устранить (или, по крайней мере, свести к минимуму) влияние систематической ошибки занижения подсчета, лучшей формой выборки является использование простой случайной выборки .
В этом типе выборки каждый член совокупности имеет равные шансы быть выбранным для включения в выборку.
Преимущество этого подхода состоит в том, что простые случайные выборки обычно репрезентативны для интересующей совокупности, поскольку каждый член имеет равные шансы быть включенным в выборку.
Когда мы используем этот подход вместо удобной выборки, мы можем быть более уверены в нашей способности экстраполировать результаты выборки на более широкую совокупность, поскольку вполне вероятно, что в выборку будут включены представители каждой (или почти каждой) группы населения. . .
Дополнительные ресурсы
Что такое предвзятость самоотбора?
Что такое SEO-предвзятость?
Что такое предвзятость в связи с отсутствием ответов?