Как определить асимметрию в коробчатых диаграммах
Ящичковая диаграмма — это тип графика, на котором отображается пятизначная сводка набора данных, которая включает в себя:
- Минимальное значение
- Первый квартиль (25-й процентиль)
- Медианное значение
- Третий квартиль (75-й процентиль)
- Максимальное значение
Для построения коробчатой диаграммы мы используем следующий процесс:
- Нарисуйте прямоугольник от первого квартиля (Q1) до третьего квартиля (Q3).
- Затем нарисуйте линию внутри рамки посередине.
- Затем нарисуйте «усы» квартилей к минимальному и максимальному значениям.
Мы можем определить, искажено ли распределение или нет, исходя из того, где находится медианное значение на коробчатой диаграмме.
Когда медиана находится ближе к нижней части ячейки, а «ус» короче в нижней части ячейки, распределение искажено вправо (или «положительно»).
Когда медиана находится ближе к верху ячейки, а «ус» короче в верхнем конце ячейки, распределение остается искаженным (или «отрицательно» искаженным).
Когда медиана находится в середине коробки и усы примерно равны с обеих сторон, распределение симметрично (или «не» асимметрично).
Следующие примеры иллюстрируют, как использовать коробчатые диаграммы, чтобы определить, имеет ли распределение перекос вправо, влево или не имеет перекоса.
Пример 1: Правое распределение
Распределение годового дохода домохозяйств в США смещено вправо. Большинство домохозяйств зарабатывают от 40 000 до 80 000 долларов в год, но в распределении есть длинный правый хвост, который представляет домохозяйства, которые зарабатывают гораздо больше.
Если бы мы создали коробчатую диаграмму для визуализации распределения доходов домохозяйств, она выглядела бы так:
Обратите внимание, что вертикальная линия внутри рамки, обозначающая медиану, намного ближе к первому квартилю, чем к третьему квартилю, а это означает, что распределение смещено вправо.
Пример 2: левостороннее распределение
Возрастное распределение смертности в большинстве групп населения смещено влево. Большинство людей живут в возрасте от 70 до 80 лет, и все меньше и меньше людей живут ниже этого возраста.
Если бы мы создали коробчатую диаграмму для визуализации возрастного распределения смертей, она выглядела бы так:
Обратите внимание, что вертикальная линия внутри рамки, обозначающая медиану, находится намного ближе к третьему квартилю, чем к первому квартилю, что означает, что распределение смещено влево.
Пример 3: симметричное распределение
Распределение самцов по размерам примерно симметрично и не имеет асимметрии. Например, средний рост мужчины в США составляет примерно 69,1 дюйма. Распределение по высоте примерно симметрично: одни ниже, другие выше.
Если бы мы создали коробчатую диаграмму для визуализации распределения роста мужчин в Соединенных Штатах, она выглядела бы так:
Обратите внимание, что вертикальная линия внутри рамки, обозначающая медиану, также близка к первому и третьему квартилю, что означает, что распределение симметрично и без асимметрии.
Дополнительные ресурсы
Распределения с перекосом влево или вправо
Как сравнивать коробчатые диаграммы: с примерами
Как создать параллельные прямоугольные диаграммы в Excel