Как интерпретировать асимметрию в статистике: с примерами
В статистике мы используем асимметрию для описания симметрии распределения.
Мы говорим, что распределение значений данных перекошено , если оно имеет «хвост» в левой части распределения:
Распределение называется перекошенным вправо, если у него есть «хвост» на правой стороне распределения:
И мы говорим, что распределение не имеет асимметрии , если оно симметрично с обеих сторон:
Как интерпретировать асимметрию
Величина асимметрии может варьироваться от отрицательной бесконечности до положительной бесконечности.
Вот как интерпретировать значения асимметрии:
- Отрицательное значение асимметрии указывает на то, что хвост находится на левой стороне распределения и простирается в сторону более отрицательных значений.
- Положительное значение асимметрии указывает на то, что хвост находится на правой стороне распределения и простирается в сторону более положительных значений.
- Нулевое значение указывает на отсутствие асимметрии в распределении, а это означает, что распределение совершенно симметрично.
Следующие примеры показывают, как интерпретировать значения асимметрии на практике.
Пример 1: левостороннее распределение
Возрастное распределение смертности в большинстве групп населения смещено влево. Большинство людей живут в возрасте от 70 до 80 лет, и все меньше и меньше людей живут ниже этого возраста.
Если бы мы создали график плотности для визуализации распределения значений возраста смерти, он мог бы выглядеть так:
Предположим, мы вычислили асимметрию этого распределения и обнаружили, что она равна -1,3225 .
Поскольку это значение отрицательное, мы интерпретируем это как означающее, что распределение смещено влево, то есть хвост простирается к левой стороне распределения.
Пример 2: правое распределение
Распределение доходов домохозяйств в Соединенных Штатах смещено вправо: большинство домохозяйств зарабатывают от 30 000 до 70 000 долларов в год, но длинный правый хвост домохозяйств зарабатывает гораздо больше.
Если мы создадим график плотности для визуализации распределения значений доходов домохозяйств, он может выглядеть так:
Предположим, мы вычислили асимметрию этого распределения и обнаружили, что она равна 2,0043 .
Поскольку это значение положительное, мы интерпретируем это как означающее, что распределение смещено вправо, то есть хвост простирается к правой стороне распределения.
Пример 3: Отсутствие предвзятости
Размеры самцов примерно нормально распределены и не имеют асимметрии. Например, средний рост мужчины в США составляет примерно 69,1 дюйма. Распределение по высоте примерно симметрично: одни ниже, другие выше.
Если бы мы создали диаграмму плотности, чтобы визуализировать распределение роста мужчин в Соединенных Штатах, она могла бы выглядеть так:
Предположим, мы вычислили асимметрию этого распределения и обнаружили, что она равна 0,0013 .
Поскольку это значение близко к нулю, мы интерпретируем это как означающее, что распределение практически не имеет перекоса, а это означает, что хвосты по обе стороны распределения примерно равны.
Дополнительные ресурсы
Следующие руководства предоставляют дополнительную информацию о статистике отклонения:
5 примеров положительно асимметричных распределений
5 примеров отрицательно искаженных распределений
Как рассчитать асимметрию в Excel
Как определить асимметрию в коробчатых диаграммах