Как создать гистограмму в r


Ленточная диаграмма — это тип диаграммы, на которой числовые данные отображаются вдоль одной полосы. Подобно коробчатым диаграммам , гистограммы помогают визуализировать распределение данных. Гистограммы могут быть хорошей альтернативой ящичковым графикам, когда размеры выборки невелики, поэтому вы можете видеть отдельные точки данных.

В этом руководстве объясняется, как создать ленточную диаграмму в R с помощью встроенной функции Stripchart() .

Функция полосовой диаграммы()

Основной синтаксис для создания гистограммы в R:

Stripchart(x, метод, джиттер, основной, xlab, ylab, col, pch, вертикальный, group.names)

  • x : числовой вектор или список числовых векторов для построения. Это единственный аргумент, необходимый для построения сюжета.
  • метод : метод, используемый для разделения точек с одинаковыми значениями. Метод «overplot» по умолчанию приводит к перерисовке этих точек, но можно указать «jitter», чтобы дрожать точки, или «stack», чтобы сложить точки.
  • jitter : когда используется метод = «jitter», это определяет величину применяемого джиттера.
  • main: название диаграммы
  • xlab : метка оси X
  • ylab : метка оси Y
  • col : цвет точек графика
  • pch : форма точек графика
  • вертикальный : если для вертикального установлено значение «ИСТИНА», путь по умолчанию рисуется вертикально, а не горизонтально.
  • group.names : метки группы, которые будут печататься рядом с графиком, если на графике нарисовано несколько числовых векторов.

Гистограмма для одного цифрового вектора

В следующем примере встроенная диафрагма набора данных R используется для создания гистограммы для одного числового вектора.

 #view first six rows of iris dataset
head(iris)

# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#1 5.1 3.5 1.4 0.2 setosa
#2 4.9 3.0 1.4 0.2 setosa
#3 4.7 3.2 1.3 0.2 setosa
#4 4.6 3.1 1.5 0.2 setosa
#5 5.0 3.6 1.4 0.2 setosa
#6 5.4 3.9 1.7 0.4 setosa

Следующий код создает диаграмму основной полосы для переменной Sepal.Length :

 stripchart(iris$Sepal.Length)

Мы также можем добавить дополнительные аргументы, чтобы добавить заголовок и метку по оси X, изменить цвет точек, изменить форму точек и использовать метод «дрожания», чтобы отдельные точки не перекрывались:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           xlab = 'Sepal Length',
           col = 'red',
           pch = 1,
           method = 'jitter')

Вместо того, чтобы смешивать точки, мы можем «сложить» их:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           xlab = 'Sepal Length',
           col = 'red',
           pch = 1,
method = 'stack' )

Мы также можем отобразить график вертикально вместо горизонтального по умолчанию и изменить метку оси, чтобы она находилась на оси Y:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
ylab = 'Sepal Length' ,
           col = 'red',
           pch = 1,
           method = 'jitter',
vertical = TRUE )

Гистограмма для нескольких числовых векторов

Мы также можем нарисовать несколько ленточных диаграмм на одном графике, передав список числовых векторов.

Следующий код создает список, содержащий переменные Sepal length и Width в наборе данных радужной оболочки, и создает гистограмму для каждой переменной на одном графике:

 #create list of variables
x <- list('Sepal Length' = iris$Sepal.Length, 'Sepal Width' = iris$Sepal.Width)

#create plot that contains one strip chart per variable
stripchart(x,
           main = 'Sepal Width & Length Distributions',
           xlab = 'Measurement', 
           ylab = 'Variable',
           col = c('steelblue', 'coral2'),
           pch = 16,
           method = 'jitter')

Как и в предыдущем примере, мы можем выбрать вертикальное отображение гистограмм вместо горизонтального по умолчанию:

 stripchart(x, main = 'Sepal Width & Length Distributions',
           xlab = 'Measurement', 
           ylab = 'Variable',
           col = c('steelblue', 'coral2'),
           pch = 16,
           method = 'jitter',
vertical = TRUE )

Кроме того, мы можем передать формулу вида y~x в функцию Stripchart(), где y — числовой вектор, сгруппированный по значению x .

Например, в наборе данных ирисов мы могли бы сгруппировать данные по видам , которые имеют три различных значения («setosa», «versicolor» и «virginica»), а затем отобразить длину чашелистика для каждого вида на гистограмме:

 stripchart(Sepal.Length ~ Species,
           data = iris,
           main = 'Sepal Length by Species',
           xlab = 'Species', 
           ylab = 'Sepal Length',
           col = c('steelblue', 'coral2', 'purple'),
           pch = 16,
           method = 'jitter',
           vertical = TRUE)

Чтобы просмотреть полную документацию по функции Stripchart() в R, просто введите:

 ?stripchart

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *