Как найти центр и разброс точечной диаграммы
Точечный график — это тип графика, который отображает частоты значений в наборе данных с использованием сложенных точек.
Часто, когда мы создаем точечный график, мы хотим количественно определить центр и распределение:
- Центр : центральная точка набора данных. Для измерения этого показателя мы часто используем медиану.
- Spread : распределение значений в наборе данных. Мы часто используем диапазон для измерения этого.
Зная только эти два значения, мы можем получить хорошее представление о том, как значения распределяются в данном наборе данных.
Следующие примеры показывают, как на практике найти центр и протяженность графика точек.
Пример 1: Точечная диаграмма допущенных ошибок
Следующий точечный график показывает количество нарушений, совершенных баскетболистами в определенной игре:
Вот как найти центр и распределение значений в этом наборе данных:
Центр : мы можем использовать медиану для измерения «центра» набора данных. Медиана представляет собой среднее значение набора данных. Чтобы найти медиану для этого конкретного набора данных, мы можем перечислить каждое значение и определить медианное значение:
Значения данных: 1, 1, 1, 1, 2, 2 , 2, 3, 4, 5, 5.
Медианное значение в этом наборе данных равно 2 .
Распространение : мы можем использовать диапазон для измерения «разброса» значений по набору данных. Диапазон представляет собой разницу между наибольшим и наименьшим значением.
В этом наборе данных мы видим, что наибольшее значение равно 5, а наименьшее значение — 1, поэтому диапазон можно рассчитать как: 5 – 1 = 4 .
Пример 2. Точечный график результатов испытаний
На следующем точечном графике показаны результаты тестов учащихся определенного класса:
Вот как найти центр и распределение значений в этом наборе данных:
Центр : мы можем использовать медиану для измерения «центра» набора данных. Чтобы найти медиану для этого конкретного набора данных, мы можем перечислить каждое значение и определить медианное значение:
Значения данных: 85, 85, 85, 85, 86, 86, 86 , 87 , 87, 87, 88, 88, 89, 89, 90, 91.
В этом наборе данных четное количество значений, поэтому медиана будет средним из двух средних значений. Медиана оказывается 87 .
Распространение : мы можем использовать диапазон для измерения «разброса» значений в наборе данных, который представляет собой разницу между самым большим и наименьшим значением.
В этом наборе данных мы видим, что наибольшее значение — 91, а наименьшее — 85, поэтому диапазон можно рассчитать как: 91 – 85 = 6 .
Дополнительные ресурсы
В следующих руководствах объясняется, как создавать точечные графики в различных статистических программах:
Как создать точечную диаграмму в Excel
Как создать точечную диаграмму в R