Как создать гистограмму относительной частоты в r


Гистограмма относительной частоты — это график, на котором отображаются относительные частоты значений в наборе данных.

В этом руководстве объясняется, как создать гистограмму относительной частоты в R с помощью функции гистограммы решетки () , которая использует следующий синтаксис:

гистограмма (x, тип)

Золото:

  • х: данные
  • тип: тип гистограммы относительной частоты, которую вы хотите создать; варианты включают процент, количество и плотность.

Гистограмма по умолчанию

Сначала загрузите пакет решетки :

 library(lattice)

По умолчанию этот пакет создает гистограмму относительной частоты с процентами по оси Y:

 #create data
data <- c(0, 0, 2, 3, 4, 4, 5, 6, 7, 12, 12, 14)

#create relative frequency histogram
histogram(data) 

Гистограмма относительной частоты в R

Редактирование гистограммы

Мы можем изменить гистограмму, включив в нее заголовок, разные метки осей и другой цвет, используя следующие аргументы:

  • главное: заголовок
  • xlab: метка оси X
  • ylab: метка оси Y
  • col: цвет заливки, используемый в гистограмме.

Например:

 #modify the histogram
histogram(data,
          main='Points per Game by Player',
          xlab='Points per Game',
          col='steelblue')

Гистограмма относительной частоты в R с использованием пакета Trellis

Изменение количества бункеров

Мы можем указать количество интервалов, которые будут использоваться в гистограмме, используя аргумент Breaks :

 #modify the number of bins
histogram(data,
          main='Points per Game by Player',
          xlab='Points per Game',
          col='steelblue',
          breaks=15 )

Гистограмма относительной частоты с подобранными интервалами в R

Чем больше категорий вы укажете, тем более детальное представление вы сможете получить о своих данных. И наоборот, чем меньше категорий вы укажете, тем более агрегированными станут данные:

 #modify the number of bins
histogram(data,
          main='Points per Game by Player',
          xlab='Points per Game',
          col='steelblue',
          breaks=3 )

Гистограмма относительной частоты в R

Связанный: Используйте правило Стерджеса , чтобы определить оптимальное количество групп для использования в гистограмме.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *