Как создать гистограмму относительной частоты в r
Гистограмма относительной частоты — это график, на котором отображаются относительные частоты значений в наборе данных.
В этом руководстве объясняется, как создать гистограмму относительной частоты в R с помощью функции гистограммы решетки () , которая использует следующий синтаксис:
гистограмма (x, тип)
Золото:
- х: данные
- тип: тип гистограммы относительной частоты, которую вы хотите создать; варианты включают процент, количество и плотность.
Гистограмма по умолчанию
Сначала загрузите пакет решетки :
library(lattice)
По умолчанию этот пакет создает гистограмму относительной частоты с процентами по оси Y:
#create data data <- c(0, 0, 2, 3, 4, 4, 5, 6, 7, 12, 12, 14) #create relative frequency histogram histogram(data)
Редактирование гистограммы
Мы можем изменить гистограмму, включив в нее заголовок, разные метки осей и другой цвет, используя следующие аргументы:
- главное: заголовок
- xlab: метка оси X
- ylab: метка оси Y
- col: цвет заливки, используемый в гистограмме.
Например:
#modify the histogram
histogram(data,
main='Points per Game by Player',
xlab='Points per Game',
col='steelblue')
Изменение количества бункеров
Мы можем указать количество интервалов, которые будут использоваться в гистограмме, используя аргумент Breaks :
#modify the number of bins histogram(data, main='Points per Game by Player', xlab='Points per Game', col='steelblue', breaks=15 )
Чем больше категорий вы укажете, тем более детальное представление вы сможете получить о своих данных. И наоборот, чем меньше категорий вы укажете, тем более агрегированными станут данные:
#modify the number of bins histogram(data, main='Points per Game by Player', xlab='Points per Game', col='steelblue', breaks=3 )
Связанный: Используйте правило Стерджеса , чтобы определить оптимальное количество групп для использования в гистограмме.