Что такое бимодальное распределение?


Бимодальное распределение — это распределение вероятностей с двумя модами.

Мы часто используем термин «режим» в описательной статистике для обозначения наиболее распространенного значения в наборе данных, но в данном случае термин «режим» относится к локальному максимуму на графике.

При просмотре бимодального распределения вы заметите два отчетливых «пика», которые представляют эти два режима.

Бимодальное распределение

Это отличается от унимодального распределения, которое имеет только один пик:

Унимодальное распределение

Вы можете запомнить разницу между ними, запомнив:

  • «би» = два
  • «единый» = один

Хотя в большинстве статистических курсов для объяснения различных тем используются унимодальные распределения, такие как нормальное распределение , на практике бимодальные распределения встречаются довольно часто, поэтому полезно знать, как их распознавать и интерпретировать.

Примечание. Бимодальное распределение — это особый тип мультимодального распределения .

Примеры бимодальных распределений

Вот несколько примеров бимодальных распределений:

Пример №1: Часы пик в ресторане

Если бы вы создали график для визуализации почасового распределения посетителей в определенном ресторане, вы, вероятно, обнаружили бы, что он соответствует бимодальному распределению с пиком в часы обеда и другим пиком в часы ужина:

Пример бимодального распределения

Пример №. 2: Средняя высота двух видов растений.

Предположим, вы гуляете по полю и измеряете высоту разных растений. Сами того не осознавая, вы измеряете размеры двух разных видов: одного довольно большого, а другого совсем маленького. Если вы создали график для визуализации распределения высот, он будет следовать бимодальному распределению:

Пример бимодального распределения

Пример №3: результаты экзамена

Предположим, учитель дает экзамен ученикам своего класса. Некоторые студенты готовились к экзамену, другие – нет. Когда преподаватель создает график результатов экзамена, он следует бимодальному распределению с пиком вокруг низких баллов для студентов, которые не учились, и другим пиком вокруг высоких баллов для студентов, которые учились:

Пример бимодального распределения с результатами испытаний

Что вызывает бимодальные распределения?

Обычно есть две вещи, которые вызывают бимодальные распределения:

1. Некоторые основные явления.

Бимодальные распределения часто возникают из-за определенных основных явлений.

Например, количество клиентов, которые посещают ресторан каждый час, подчиняется бимодальному распределению, поскольку люди, как правило, едят в ресторанах в два разных времени: обед и ужин. Это основное человеческое поведение является источником бимодального распределения.

2. Две разные группы сгруппировались вместе.

Бимодальные распределения также могут возникнуть, когда вы просто анализируете две разные группы вещей, не осознавая этого.

Например, если вы измеряете высоту растений на определенном поле, не осознавая, что на одном поле растут два разных вида, при создании графика вы увидите бимодальное распределение.

Как анализировать бимодальные распределения

Мы часто описываем распределения, используя среднее значение или медиану, потому что это дает нам представление о том, где находится «центр» распределения.

К сожалению, среднее значение и медиану бесполезно знать для бимодального распределения. Например, средний балл на экзамене студентов в приведенном выше примере составляет 81:

Однако очень немногие студенты набрали хотя бы около 81 балла. В данном случае среднее значение вводит в заблуждение. Большинство студентов набрали около 74 или 88 баллов.

Лучший способ анализа и интерпретации бимодальных распределений — просто разделить данные на две отдельные группы, а затем проанализировать центр и распределение для каждой группы.

Например, мы можем разделить результаты экзамена на «низкие баллы» и «высокие баллы», а затем найти среднее и стандартное отклонение для каждой группы.

Если вы делитесь результатами анализа, и ваши данные соответствуют бимодальному распределению, полезно создать гистограмму, подобную показанной выше, чтобы ваша аудитория могла ясно видеть, что распределение имеет два различных «пика» и что оно только увеличивает смысл анализировать каждый пик отдельно, а не как один большой набор данных.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *