Як створити гістограму в r


Смугова діаграма — це тип діаграми, який відображає числові дані вздовж однієї смуги. Подібно до прямокутних діаграм , стовпчасті діаграми можуть допомогти вам візуалізувати розподіл даних. Стовпчасті діаграми можуть бути гарною альтернативою коробчатим діаграмам, якщо розмір вибірки невеликий, тож ви можете бачити окремі точки даних.

У цьому посібнику пояснюється, як створити стрічкову діаграму в R за допомогою вбудованої функції stripchart() .

Функція stripchart().

Основний синтаксис для створення гістограми в R:

stripchart(x, method, jitter, main, xlab, ylab, col, pch, vertical, group.names)

  • x : числовий вектор або список числових векторів для побудови. Це єдиний аргумент, необхідний для створення сюжету.
  • method : метод, який використовується для розділення точок, які мають ідентичні значення. За замовчуванням метод «overplot» спричиняє перепланування цих точок, але можна вказати «jitter» для коливання точок або «stack» для сумування точок.
  • тремтіння : коли використовується метод = “тремтіння”, це забезпечує кількість тремтіння, яке потрібно застосувати.
  • основний: назва діаграми
  • xlab : мітка осі x
  • ylab : мітка осі y
  • col : колір точок графіка
  • pch : форма точок графіка
  • vertical : якщо vertical має значення «TRUE», за замовчуванням шлях малюється вертикально, а не горизонтально
  • group.names : групові мітки для друку поруч із графіком, якщо нанесено кілька числових векторів.

Гістограма для одного цифрового вектора

У наступному прикладі використовується вбудований ірис набору даних R для створення гістограми для одного числового вектора.

 #view first six rows of iris dataset
head(iris)

# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#1 5.1 3.5 1.4 0.2 setosa
#2 4.9 3.0 1.4 0.2 setosa
#3 4.7 3.2 1.3 0.2 setosa
#4 4.6 3.1 1.5 0.2 setosa
#5 5.0 3.6 1.4 0.2 setosa
#6 5.4 3.9 1.7 0.4 setosa

Наступний код створює діаграму основної смуги для змінної Sepal.Length :

 stripchart(iris$Sepal.Length)

Ми також можемо додати додаткові аргументи, щоб додати заголовок і мітку на осі x, змінити колір точок, змінити форму точок і використовувати метод «тремтіння», щоб окремі точки не накладалися:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           xlab = 'Sepal Length',
           col = 'red',
           pch = 1,
           method = 'jitter')

Замість того, щоб змішувати точки, ми можемо «складати» їх:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           xlab = 'Sepal Length',
           col = 'red',
           pch = 1,
method = 'stack' )

Ми також можемо відобразити графік вертикально замість горизонтального за замовчуванням і змінити мітку осі на вісь y:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
ylab = 'Sepal Length' ,
           col = 'red',
           pch = 1,
           method = 'jitter',
vertical = TRUE )

Гістограма для кількох числових векторів

Ми також можемо намалювати кілька смужкових діаграм на одному графіку, передавши список числових векторів.

Наступний код створює список, що містить змінні довжини та ширини чашолистка в наборі даних райдужної оболонки, і створює гістограму для кожної змінної на одному графіку:

 #create list of variables
x <- list('Sepal Length' = iris$Sepal.Length, 'Sepal Width' = iris$Sepal.Width)

#create plot that contains one strip chart per variable
stripchart(x,
           main = 'Sepal Width & Length Distributions',
           xlab = 'Measurement', 
           ylab = 'Variable',
           col = c('steelblue', 'coral2'),
           pch = 16,
           method = 'jitter')

Так само, як і в попередньому прикладі, ми можемо побудувати гістограму вертикально замість горизонтальної за замовчуванням:

 stripchart(x, main = 'Sepal Width & Length Distributions',
           xlab = 'Measurement', 
           ylab = 'Variable',
           col = c('steelblue', 'coral2'),
           pch = 16,
           method = 'jitter',
vertical = TRUE )

Крім того, ми можемо передати формулу у вигляді y~x у функцію stripchart(), де y — числовий вектор, згрупований за значенням x .

Наприклад, у наборі даних райдужної оболонки ми можемо згрупувати дані за видами , які мають три різні значення (“setosa”, “versicolor” і “virginica”), а потім побудувати довжину чашолистка для кожного виду на гістограмі:

 stripchart(Sepal.Length ~ Species,
           data = iris,
           main = 'Sepal Length by Species',
           xlab = 'Species', 
           ylab = 'Sepal Length',
           col = c('steelblue', 'coral2', 'purple'),
           pch = 16,
           method = 'jitter',
           vertical = TRUE)

Щоб переглянути повну документацію щодо функції stripchart() у R, просто введіть:

 ?stripchart

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *