Что такое мультимодальная дистрибуция?


Мультимодальное распределение — это распределение вероятностей с двумя или более модами.

Если вы создадите гистограмму для визуализации мультимодального распределения, вы заметите, что оно имеет несколько пиков:

Мультимодальная дистрибуция

Если распределение имеет ровно два пика, то оно считается бимодальным распределением , которое представляет собой особый тип мультимодального распределения.

Это контрастирует с унимодальным распределением, которое имеет только один пик:

Хотя унимодальные распределения, такие как нормальное распределение, чаще всего используются для объяснения тем в статистике, мультимодальные распределения на самом деле встречаются довольно часто на практике, поэтому полезно знать, как их распознавать и анализировать.

Примеры мультимодальных распределений

Вот несколько примеров мультимодальных распределений.

Пример 1: Распределение результатов экзамена

Предположим, профессор сдает экзамен своему классу. Некоторые студенты учились, другие нет. Когда профессор создает гистограмму экзаменационных баллов, она следует мультимодальному распределению с пиком в районе низких баллов для студентов, которые не учились, и другим пиком в районе высоких баллов для студентов, которые учились:

Пример мультимодальной доставки

Пример 2: Высота разных видов растений

Предположим, учёный ходит по полю и измеряет высоту разных растений. Сама того не осознавая, она измеряет размеры трех разных видов: одного довольно большого, другого среднего и совсем маленького.

Когда она создает гистограмму для визуализации распределения высот, она обнаруживает, что оно мультимодальное: каждый пик представляет собой наиболее распространенную высоту трех разных видов.

Пример мультимодальной доставки

Пример 3: Распределение клиентов

Владелец ресторана отслеживает количество посетителей каждый час. Когда он создает гистограмму для визуализации распределения клиентов, он видит, что распределение мультимодальное: есть пик во время обеда и еще один пик во время ужина.

Каковы причины мультимодальных распределений?

Обычно в основе мультимодального распределения лежит одна из двух причин:

1. Несколько групп сгруппированы вместе.

Мультимодальные распределения могут возникать, когда вы собираете данные для нескольких групп, не осознавая этого.

Например, если ученый по незнанию измерит высоту трех разных видов растений, расположенных на одном поле, распределение всех растений будет мультимодальным, если их поместить на одну и ту же гистограмму.

2. Существует основное явление.

Мультимодальные распределения также могут возникать из-за определенных основных явлений.

Например, количество клиентов, которые посещают ресторан каждый час, подчиняется мультимодальному распределению, поскольку люди, как правило, едят в ресторанах в два разных времени: обед и ужин. Это основное человеческое поведение является источником мультимодального распределения.

Как анализировать мультимодальные распределения

Мы часто описываем распределения, используя среднее значение или медиану, потому что это дает нам представление о том, где находится «центр» распределения.

К сожалению, среднее значение и медиану бесполезно знать для бимодального распределения. Например, средний балл на экзамене студентов в приведенном выше примере составляет 81:

Однако очень немногие студенты набрали хотя бы около 81 балла. В данном случае среднее значение вводит в заблуждение. Большинство студентов на самом деле набрали около 74 или 88 баллов.

Лучший способ проанализировать и интерпретировать бимодальные распределения — просто разделить данные на две отдельные группы, а затем проанализировать расположение центра и распределение для каждой группы индивидуально.

Например, мы можем разделить результаты экзамена на «низкие баллы» и «высокие баллы», а затем найти среднее и стандартное отклонение для каждой группы.

При расчете сводной статистики для данного распределения, такого как среднее, медиана или стандартное отклонение, обязательно визуализируйте распределение, чтобы определить, является ли оно унимодальным или мультимодальным.

Если распределение является мультимодальным, описание его с использованием одного среднего значения, медианы или стандартного отклонения может ввести в заблуждение.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *