Błąd niedoszacowania: wyjaśnienie i przykłady

Przez Benjamin Anderson 29 lipca, 2023 Przewodnik 0 komentarzy

Błąd zaniżenia to błąd, który pojawia się, gdy niektórzy członkowie populacji nie są wystarczająco reprezentowani w próbie.

Ten rodzaj błędu systematycznego często występuje podczas próbkowania dla wygody i próbkowania w odpowiedzi dobrowolnej , podczas których pobiera się próbkę, która jest łatwa do uzyskania, ale często powoduje zaniżenie liczby niektórych członków populacji.

Dlaczego stronniczość zaniżenia stanowi problem?

Problemem jest błąd zaniżenia wyniku, ponieważ powoduje, że próbka nie jest reprezentatywna dla populacji. Celem gromadzenia danych dla próby jest uzyskanie danych w szybszy i prostszy sposób niż w przypadku zbierania danych dla całej populacji oraz możliwość ekstrapolacji wyników z próby na większą populację. szeroki.

Aby jednak ekstrapolować wyniki, próba musi być reprezentatywna dla całej populacji . Idealnie byłoby, gdyby nasza próba była „mini” wersją populacji. Niestety, błąd w liczeniu zaniżonych wyników może spowodować, że osoby w naszej próbie będą wyglądać zupełnie inaczej niż osoby w szerszej populacji.

Załóżmy na przykład, że badacze chcą wiedzieć, co obywatele danego miasta myślą o potencjalnym nowym prawie. Aby zebrać dane, udają się do pobliskiej biblioteki i pytają odwiedzających, co myślą o potencjalnym nowym prawie. Chociaż jest to wygodny sposób gromadzenia danych, badacze ryzykują zaniżenie liczby kilku typów osób, w tym:

Ludzie zamknięci w domach
Ludzie, którzy po prostu nie lubią odwiedzać biblioteki
Ludzie, którzy chodzą do innej biblioteki w innej części miasta

Ponieważ badanie to wyklucza pewne typy osób, jest mało prawdopodobne, aby jego wyniki były reprezentatywne dla populacji.

Załóżmy na przykład, że osoby często odwiedzające tę konkretną bibliotekę są znacznie bardziej skłonne do wspierania potencjalnego nowego prawa niż reszta populacji. Oznacza to, że gdy znane będą wyniki badania, okaże się, że wysoki odsetek mieszkańców tego miasta popiera potencjalne nowe prawo, podczas gdy w rzeczywistości większość obywateli tego nie popiera.

Poniższy rysunek ilustruje ten problem: załóżmy, że zielone kółka reprezentują ludzi opowiadających się za nowym prawem, a czerwone kółka reprezentują ludzi sprzeciwiających się nowemu prawu:

Należy zauważyć, że próba obejmuje większość zwolenników nowego prawa, ale nie jest ona reprezentatywna dla całej populacji. Wyniki ankiety podobno pokazują, że większość ludzi opowiada się za nowym prawem, choć w rzeczywistości tak nie jest.

Przykłady błędu zaniżenia

Poniższe przykłady ilustrują kilka przypadków, w których może wystąpić błąd zaniżenia wyniku.

Przykład 1

Naukowcy chcą wiedzieć, co mieszkańcy danego miasta myślą o budowie nowego parku. Aby zebrać dane, badacze biorą udział w lokalnych spotkaniach miejskich i pytają mieszkańców o ich przemyślenia. Niestety, w przypadku tej formy doboru próby dla wygody może wystąpić zaniżenie następujących grup:

Osoby, które nie mają dostępu do transportu, aby dojechać na spotkania gminne
Ludzi, którzy nawet nie wiedzą, że odbywają się zebrania miejskie
Ludzie, którzy pracują wieczorami i po prostu nie mogą uczestniczyć w zebraniach miejskich

Dlatego też opinie tych osób nie będą brane pod uwagę w wynikach badania. Ze względu na niedoszacowanie tych konkretnych grup jest mało prawdopodobne, aby próba była reprezentatywna dla całej populacji.

Przykład 2

Naukowcy chcą wiedzieć, ile godzin dziennie ludzie w danym kraju oglądają telewizję. Aby zebrać dane do badania, losowo wybierają nazwiska z lokalnej książki telefonicznej i dzwonią do ludzi, aby zapytać ich o sposób korzystania z telewizji. Jest to forma doboru próby dla wygody i może powodować zaniżenie następujących grup:

Bardzo zamożni ludzie, którzy nie umieszczają swoich numerów telefonów w lokalnych książkach telefonicznych
Młodzi ludzie, którzy korzystają wyłącznie z telefonów komórkowych i których numery nie są wymienione w lokalnych książkach telefonicznych

Tym samym ilość telewizji oglądanej przez osoby bardzo zamożne i młode będzie w tym badaniu niedoszacowana. Ze względu na niedoszacowanie tych konkretnych grup jest mało prawdopodobne, aby próba była reprezentatywna dla całej populacji.

Przykład 3

Naukowcy chcą wiedzieć, co mieszkańcy danego miasta myślą o nowym kodeksie drogowym. Rozdają więc ankietę osobom przechodzącym przez lokalne centrum handlowe. Jest to forma doboru wygodnego, która może ucierpieć w przypadku niedostatecznego pokrycia następujących grup:

Osoby, które nie mają dostępu do transportu, aby dostać się do centrum handlowego (w związku z czym kodeks drogowy w dużej mierze ich nie dotyczy)
Osoby, które nie lubią chodzić do centrum handlowego (i dlatego mogą zdecydować się nie jeździć w ruchliwych miejscach)
Ludzie udają się do innego centrum handlowego w innym mieście

Jak zapobiegać stronniczości polegającej na zaniżaniu liczby obliczeń

Błąd zaniżenia często wynika z próbkowania dla wygody. Aby wyeliminować (lub przynajmniej zminimalizować) skutki błędu systematycznego zaniżenia, lepszą formą próbkowania jest użycie prostej próby losowej .

W próbie tego typu każdy członek populacji ma równe szanse na znalezienie się w próbie.

Zaletą tego podejścia jest to, że proste próbki losowe są na ogół reprezentatywne dla populacji będącej przedmiotem zainteresowania, ponieważ każdy członek ma równe szanse na włączenie do próby.

Stosując to podejście zamiast doboru wygodnego, możemy być bardziej pewni, że potrafimy ekstrapolować wyniki próby na szerszą populację, ponieważ jest prawdopodobne, że próba obejmuje członków każdej (lub prawie każdej) grupy populacji . .

Dodatkowe zasoby

Czym jest błąd w zakresie samoselekcji?
Co to jest stronniczość SEO?
Co to jest stronniczość braku odpowiedzi?

o autorze

Dr Benjamin Anderson

Cześć, jestem Benjamin i jestem emerytowanym profesorem statystyki, który został oddanym nauczycielem Statorials. Dzięki bogatemu doświadczeniu i wiedzy specjalistycznej w dziedzinie statystyki chętnie dzielę się swoją wiedzą, aby wzmocnić pozycję uczniów za pośrednictwem Statorials. Wiedzieć więcej