Що таке бімодальний розподіл?
Бімодальний розподіл — це розподіл ймовірностей із двома модами.
Ми часто використовуємо термін «режим» в описовій статистиці для позначення найпоширенішого значення в наборі даних, але в цьому випадку термін «режим» стосується локального максимуму на графіку.
Переглядаючи бімодальний розподіл, ви помітите два чітких «піки», які представляють ці два режими.
Це відрізняється від унімодального розподілу, який має лише один пік:
Ви можете запам’ятати різницю між ними, згадавши:
- «бі» = два
- «об’єднаний» = один
Хоча більшість статистичних курсів використовують унімодальні розподіли, такі як нормальний розподіл , для пояснення різних тем, бімодальні розподіли зустрічаються досить часто на практиці, тому корисно знати, як їх розпізнавати та інтерпретувати.
Примітка. Бімодальний розподіл — це окремий тип мультимодального розподілу .
Приклади бімодальних розподілів
Ось кілька прикладів бімодальних розподілів:
Приклад №1: години пік ресторану
Якщо ви створили графік для візуалізації погодинного розподілу клієнтів у певному ресторані, ви, ймовірно, виявите, що він відповідає бімодальному розподілу з піком під час обіду та іншим піком під час вечері:
Приклад № 2: Середня висота двох видів рослин
Припустімо, ви ходите по полю і вимірюєте висоту різних рослин. Не усвідомлюючи цього, ви вимірюєте розміри двох різних видів: одного досить великого, а іншого досить маленького. Якщо ви створили графік для візуалізації розподілу висот, він відповідатиме бімодальному розподілу:
Приклад №3: результати іспиту
Припустимо, вчитель дає іспит своїм студентам. Деякі студенти готувалися до іспиту, інші – ні. Коли вчитель створює графік результатів іспиту, він дотримується бімодального розподілу з піком навколо низьких балів для студентів, які не навчалися, та іншим піком навколо високих балів для студентів, які навчалися:
Що викликає бімодальний розподіл?
Загалом існує дві речі, які спричиняють бімодальний розподіл:
1. Деякі основні явища.
Бімодальний розподіл часто виникає через певні основні явища.
Наприклад, кількість клієнтів, які відвідують ресторан щогодини, має бімодальний розподіл, оскільки люди, як правило, їдять у ресторанах у два різні години: обід і вечерю. Ця поведінка людини є джерелом бімодального розподілу.
2. Дві різні групи, згруповані разом.
Бімодальний розподіл також може виникнути, коли ви просто аналізуєте дві різні групи речей, не усвідомлюючи цього.
Наприклад, якщо ви вимірюєте висоту рослин на певному полі, не усвідомлюючи, що на одному полі ростуть два різні види, під час створення графіка ви побачите бімодальний розподіл.
Як аналізувати бімодальний розподіл
Ми часто описуємо розподіл за допомогою середнього або медіани , оскільки це дає нам уявлення про те, де знаходиться «центр» розподілу.
На жаль, для бімодального розподілу не корисно знати середнє значення та медіану. Наприклад, середній іспитовий бал студентів у прикладі вище становить 81:
Однак дуже небагато студентів набрали близько 81. У цьому випадку середнє значення вводить в оману. Більшість студентів насправді отримали близько 74 або 88 балів.
Кращий спосіб аналізу та інтерпретації бімодальних розподілів – це просто розділити дані на дві окремі групи, а потім проаналізувати центр і розподіл для кожної групи.
Наприклад, ми можемо розділити результати іспитів на «низькі бали» та «високі бали», а потім знайти середнє значення та стандартне відхилення для кожної групи.
Якщо ви ділитеся результатами аналізу, і ваші дані мають бімодальний розподіл, корисно створити гістограму, подібну до наведених вище, щоб ваша аудиторія могла чітко бачити, що розподіл має два чіткі «піки» і що він лише сенс аналізувати кожен пік окремо, а не як один великий набір даних.