Що таке мультимодальний розподіл?
Мультимодальний розподіл — це розподіл імовірностей з двома або більше модами.
Якщо ви створите гістограму для візуалізації мультимодального розподілу, ви помітите, що вона має кілька піків:
Якщо розподіл має рівно два піки, то він вважається бімодальним розподілом , який є особливим типом мультимодального розподілу.
Це контрастує з унімодальним розподілом, який має лише один пік:
Хоча унімодальні розподіли, такі як нормальний розподіл, найчастіше використовуються для пояснення тем у статистиці, мультимодальні розподіли насправді досить часто зустрічаються на практиці, тому корисно знати, як їх розпізнавати та аналізувати.
Приклади мультимодальних розподілів
Ось кілька прикладів мультимодального розподілу.
Приклад 1: Розподіл результатів іспиту
Припустимо, професор дає іспит своєму класу. Одні студенти навчалися, інші ні. Коли професор створює гістограму екзаменаційних балів, вона дотримується мультимодального розподілу з піком навколо низьких балів для студентів, які не навчалися, та іншим піком навколо високих балів для студентів, які навчалися:
Приклад 2: Висота різних видів рослин
Припустімо, що вчений обходить поле і вимірює висоту різних рослин. Сама того не усвідомлюючи, вона вимірює розміри трьох різних видів: один досить великий, інший середнього розміру і ще один зовсім маленький.
Коли вона створює гістограму для візуалізації розподілу висоти, вона виявляє, що він мультимодальний: кожен пік представляє найпоширенішу висоту трьох різних видів.
Приклад 3: Розподіл клієнтів
Власник ресторану відстежує кількість відвідувачів щогодини. Коли він створює гістограму для візуалізації розподілу клієнтів, він бачить, що розподіл є мультимодальним: є пік під час обіду та інший пік під час обіду.
Які причини мультимодального розподілу?
Зазвичай в основі мультимодального розподілу лежить одна з двох причин:
1. Кілька груп об’єднані разом.
Мультимодальний розподіл може виникнути, коли ви збираєте дані для кількох груп, не усвідомлюючи цього.
Наприклад, якщо вчений несвідомо вимірює висоту трьох різних видів рослин, розташованих на одному полі, розподіл усіх рослин буде виглядати мультимодальним, якщо їх розмістити на одній гістограмі.
2. Є приховане явище.
Мультимодальний розподіл також може відбуватися через певні основні явища.
Наприклад, кількість клієнтів, які відвідують ресторан щогодини, відповідає мультимодальному розподілу, оскільки люди, як правило, їдять у ресторанах у два різні години: обід і вечеря. Ця людська поведінка є джерелом мультимодального розподілу.
Як аналізувати мультимодальні розподіли
Ми часто описуємо розподіл за допомогою середнього або медіани , оскільки це дає нам уявлення про те, де знаходиться «центр» розподілу.
На жаль, для бімодального розподілу не корисно знати середнє та медіану. Наприклад, середній іспитовий бал студентів у прикладі вище становить 81:
Однак дуже небагато студентів набрали близько 81. У цьому випадку середнє значення вводить в оману. Більшість студентів насправді отримали близько 74 або 88 балів.
Кращий спосіб аналізу та інтерпретації бімодальних розподілів – це просто розділити дані на дві окремі групи, а потім проаналізувати розташування центру та розподіл для кожної групи окремо.
Наприклад, ми можемо розділити результати іспитів на «низькі бали» та «високі бали», а потім знайти середнє значення та стандартне відхилення для кожної групи.
Під час обчислення підсумкових статистичних даних для заданого розподілу, наприклад середнього, медіани або стандартного відхилення, обов’язково візуалізуйте розподіл, щоб визначити, чи є він унімодальним чи мультимодальним.
Якщо розподіл є мультимодальним, описувати його за допомогою одного середнього значення, медіани або стандартного відхилення може ввести в оману.