Как построить график распределения значений столбцов в r


Для построения графика распределения значений столбцов в R можно использовать следующие методы:

Способ 1. Постройте распределение значений, используя график плотности.

 plot(density(df$my_column))

Способ 2. Постройте распределение значений с помощью гистограммы.

 hist(df$my_column)

Следующие примеры показывают, как использовать каждый метод на практике со следующим фреймом данных.

 #create data frame
df = data. frame (team=rep(c(' A ', ' B '), each= 10 ),
                points=c(3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 8,
                         7, 8, 9, 12, 12, 12, 14, 15, 17))

#view data frame
df

   team points
1 to 3
2 to 3
3 to 4
4 to 5
5 to 4
6 to 7
7 to 7
8 to 7
9 to 10
10 to 11
11 B 8
12 B 7
13 B 8
14 B 9
15 B 12
16 B 12
17 B 12
18 B 14
19 B 15
20 B 17

Пример 1. Постройте график распределения значений с помощью графика плотности

Следующий код показывает, как построить график распределения значений в столбце точек с помощьюграфика плотности :

 #plot distribution of values in points column
plot(density(df$points)) 

Этот синтаксис создает плавную кривую, которая суммирует распределение значений переменной.

Обратите внимание, что мы также можем изменить заголовок, метки осей и цвет линий на графике плотности, если захотим:

 #plot distribution of values in points column
plot(density(df$points), col=' red ', main=' Density Plot of Points ', xlab=' Points ')

постройте распределение значений столбцов в R, используя график плотности

Пример 2. Постройте график распределения значений с помощью гистограммы

Следующий код показывает, как построить график распределения значений в столбце точек с помощью гистограммы:

 #plot distribution of values in points column using histogram
hist(df$points)

Гистограмма использует столбцы для представления частот значений в столбце точек , а не плавную линию, которая суммирует форму распределения.

Обратите внимание, что мы также можем изменить заголовок, метки осей, цвет и количество переходов, используемых в гистограмме:

 #plot distribution of values in points column using histogram
hist(df$points, main=' Histogram of Points ', xlab=' Points ', col=' steelblue ', breaks= 12 )

построить распределение значений столбцов в R с помощью гистограммы

Примечание . Чем больше значение вы выберете для аргумента разрывов , тем больше столбцов будет на гистограмме.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:

Как добавить вертикальную линию на гистограмму в R
Как создать графики плотности ядра в R
Как накладывать графики плотности в ggplot2

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *