Co to jest dystrybucja bimodalna?


Rozkład bimodalny to rozkład prawdopodobieństwa z dwoma modami.

Często używamy terminu „tryb” wstatystykach opisowych w odniesieniu do najczęstszej wartości w zbiorze danych, ale w tym przypadku termin „tryb” odnosi się do lokalnego maksimum na wykresie.

Przeglądając rozkład bimodalny, zauważysz dwa różne „szczyty”, które reprezentują te dwa tryby.

Dystrybucja bimodalna

Różni się to od rozkładu unimodalnego, który ma tylko jeden pik:

Dystrybucja jednomodalna

Możesz zapamiętać różnicę między nimi, pamiętając:

  • „bi” = dwa
  • „zjednoczeni” = jeden

Chociaż większość kursów statystycznych do wyjaśnienia różnych zagadnień wykorzystuje rozkłady jednomodalne, takie jak rozkład normalny , w praktyce rozkłady bimodalne pojawiają się dość często, dlatego warto wiedzieć, jak je rozpoznać i zinterpretować.

Uwaga: dystrybucja bimodalna jest specyficznym typem dystrybucji multimodalnej .

Przykłady rozkładów bimodalnych

Oto kilka przykładów rozkładów bimodalnych:

Przykład nr 1: Godziny szczytu restauracji

Jeśli utworzysz wykres wizualizujący godzinowy rozkład klientów w określonej restauracji, prawdopodobnie zauważysz, że ma on rozkład bimodalny, ze szczytem w godzinach lunchu i kolejnym szczytem w godzinach kolacji:

Przykład rozkładu bimodalnego

Przykład nr. 2: Średnia wysokość dwóch gatunków roślin

Załóżmy, że spacerujesz po polu i mierzysz wysokość różnych roślin. Nie zdając sobie z tego sprawy, mierzysz wielkość dwóch różnych gatunków: jednego dość dużego i drugiego dość małego. Jeśli utworzysz wykres wizualizujący rozkład wysokości, będzie on zgodny z rozkładem bimodalnym:

Przykład rozkładu bimodalnego

Przykład nr 3: wyniki egzaminu

Załóżmy, że nauczyciel zdaje egzamin swojej klasie. Niektórzy uczniowie uczyli się do egzaminu, inni nie. Gdy nauczyciel tworzy wykres wyników egzaminów, ma on rozkład dwumodalny, w którym szczyt dotyczy niskich wyników uczniów, którzy się nie uczyli, a drugi szczyt dotyczy wysokich wyników uczniów, którzy się uczyli:

Przykład rozkładu bimodalnego z wynikami badań

Co powoduje rozkłady bimodalne?

Generalnie są dwie rzeczy, które powodują rozkłady bimodalne:

1. Niektóre podstawowe zjawiska.

Rozkłady bimodalne często występują z powodu pewnych podstawowych zjawisk.

Na przykład liczba klientów odwiedzających restaurację co godzinę ma rozkład bimodalny, ponieważ ludzie jadą w restauracjach o dwóch różnych porach: lunchu i kolacji. To podstawowe ludzkie zachowanie jest źródłem rozkładu bimodalnego.

2. Dwie różne grupy zgrupowane razem.

Rozkłady bimodalne mogą również wystąpić, gdy po prostu przeanalizujesz dwie różne grupy rzeczy, nie zdając sobie z tego sprawy.

Na przykład, jeśli zmierzysz wysokość roślin na określonym polu, nie zdając sobie sprawy, że na tym samym polu rosną dwa różne gatunki, podczas tworzenia wykresu zobaczysz rozkład bimodalny.

Jak analizować rozkłady bimodalne

Często opisujemy rozkłady za pomocą średniej lub mediany, ponieważ daje nam to pojęcie, gdzie znajduje się „środek” rozkładu.

Niestety, znajomość średniej i mediany nie jest przydatna w przypadku rozkładu bimodalnego. Na przykład średni wynik egzaminu uczniów w powyższym przykładzie wynosi 81:

Jednak bardzo niewielu uczniów uzyskało wynik w okolicach 81. W tym przypadku średnia jest myląca. Większość uczniów faktycznie uzyskała wynik około 74 lub 88.

Lepszym sposobem analizowania i interpretowania rozkładów bimodalnych jest po prostu podzielenie danych na dwie odrębne grupy, a następnie przeanalizowanie środka i rozkładu dla każdej grupy.

Na przykład możemy podzielić wyniki egzaminu na „niskie wyniki” i „wysokie wyniki”, a następnie znaleźć średnią i odchylenie standardowe dla każdej grupy.

Jeśli udostępniasz wyniki analizy, a Twoje dane mają rozkład bimodalny, pomocne jest utworzenie histogramu podobnego do pokazanego powyżej, aby odbiorcy mogli wyraźnie zobaczyć, że rozkład ma dwa różne „szczyty” i że stanowi jedynie sensowne jest analizowanie każdego piku osobno, a nie jako jednego dużego zbioru danych.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *