Błąd berksona: definicja + przykłady


Błąd Berksona to rodzaj błędu systematycznego, który pojawia się w badaniach, gdy dwie zmienne wydają się być ujemnie skorelowane w danych próbki, ale w rzeczywistości są dodatnio skorelowane w całej populacji .

Załóżmy na przykład, że Tomek chce zbadać korelację między jakością hamburgerów i koktajli mlecznych w lokalnych restauracjach.

Wychodzi i zbiera następujące dane na temat siedmiu różnych restauracji:

Tworzy wykres punktowy do wizualizacji danych:

Przykład paradoksu Berksona

Współczynnik korelacji Pearsona pomiędzy tymi dwiema zmiennymi wynosi -0,75 , co odpowiada silnej korelacji ujemnej.

To odkrycie jest dla Toma sprzeczne z intuicją: pomyślałby, że restauracje, które robią dobre hamburgery, robią też dobre koktajle mleczne.

Okazuje się jednak, że Tom po prostu zignorował wszystkie restauracje w mieście, które robią zarówno kiepskie burgery , jak i kiepskie koktajle mleczne.

Gdyby odwiedził te restauracje, zebrałby następujący zestaw danych:

A tak wygląda wykres rozrzutu dla tego zbioru danych:

Współczynnik korelacji Pearsona pomiędzy obiema zmiennymi okazuje się wynosić 0,46 , co oznacza umiarkowanie silną dodatnią korelację.

Badając jedynie podzbiór restauracji w mieście, Tom błędnie doszedł do wniosku, że istnieje ujemna korelacja między jakością burgerów i koktajli mlecznych.

Okazuje się bowiem, że pomiędzy tymi dwiema zmiennymi istnieje dodatnia zależność (jak można się było spodziewać). To klasyczny przykład stronniczości Berksona.

Zobacz poniższe przykłady innych scenariuszy, w których w praktyce występuje stronniczość Berksona.

Przykład 1: Rekrutacja na studia

Załóżmy, że uczelnia przyjmuje tylko studentów, którzy mają wystarczająco wysoki wynik GPA i ACT.

Powszechnie wiadomo, że te dwie zmienne są ze sobą dodatnio skorelowane, okazuje się jednak, że wśród studentów decydujących się na naukę w danej uczelni wydaje się, że istnieje między nimi ujemna korelacja.

Jednak ta ujemna korelacja występuje tylko dlatego, że studenci, którzy mają zarówno wysoki wynik GPA, jak i ACT, mogą studiować na elitarnym uniwersytecie, podczas gdy studenci, którzy mają zarówno niski wynik GPA, jak i ACT, nie są w ogóle przyjmowani.

Chociaż korelacja między ACT i GPA jest w populacji dodatnia, w próbie korelacja wydaje się ujemna. Jest to przypadek stronniczości ze strony Berksona.

Przykład 2: Preferencje randkowe

Wiele osób umawia się tylko z partnerami, którzy są atrakcyjni i mają dobrą osobowość.

W prawdziwym świecie może nie być korelacji między tymi dwiema zmiennymi, ale zawężając grupę randkową, dana osoba może całkowicie zignorować potencjalnych partnerów, którzy są zarówno nieatrakcyjni, jak i utalentowani. „dobra osobowość”.

Zatem wśród potencjalnych partnerów może się wydawać, że istnieje ujemna korelacja pomiędzy tymi dwiema zmiennymi: osoby bardziej atrakcyjne mają gorszą osobowość, a osoby o lepszej osobowości wydają się mniej atrakcyjne.

stronniczość Berksona

Chociaż w populacji nie ma korelacji między tymi dwiema zmiennymi, wydaje się, że w próbie potencjalnych partnerów występuje korelacja ujemna. Jest to po prostu przypadek stronniczości Berksona.

Jak zapobiegać stronniczości Berksona

Najbardziej oczywistym sposobem uniknięcia stronniczości Berksona w badaniach naukowych jest pobranie prostej losowej próbki z populacji. Innymi słowy, upewnij się, że każdy członek populacji będącej przedmiotem zainteresowania ma równe szanse na włączenie do próby.

Na przykład, jeśli badasz częstość występowania chorób w danym kraju, musisz zebrać próbę osób z całego kraju, a nie tylko tych, do których łatwo dotrzeć w szpitalach.

Korzystając z prostej próby losowej, badacze mogą zmaksymalizować szansę, że wybrana przez nich próba będzie reprezentatywna dla populacji, co oznacza, że będą mogli z całą pewnością uogólnić swoje ustalenia z próbki na całą populację.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *