Как создать облака точек по группам в r (2 примера)


Для создания диаграммы рассеяния на основе кластеров в R можно использовать следующие методы:

Метод 1: используйте базу R

 plot(df$x, df$y, col=as. factor (df$group))

Способ 2: используйте ggplot2

 library (ggplot2)

ggplot(df, aes (x, y)) +
  geom_point( aes (color=group))

Следующие примеры показывают, как использовать каждый метод на практике со следующим фреймом данных:

 #create data frame
df <- data. frame (x=c(1, 2, 2, 3, 5, 6, 7),
                 y=c(4, 8, 7, 9, 15, 14, 20),
                 group=c('A', 'A', 'A', 'B', 'B', 'B', 'B'))

#view data frame
df

  xy group
1 1 4 A
2 2 8 A
3 2 7 A
4 3 9 B
5 5 15 B
6 6 14 B
7 7 20 B

Пример 1: облако точек по группам в базе R

Следующий код показывает, как создать облако точек в базе R, где точки окрашены в соответствии со значением переменной group:

 #create scatterplot with points colored by group
plot(df$x, df$y, col=as. factor (df$group), pch= 19 )

Цвет каждой точки отражает значение переменной «группа» во фрейме данных.

Точки со значением «группы» A отображаются черным цветом, а точки со значением «группы» B отображаются красным.

Обратите внимание, что pch=19 указывает R использовать сплошные кружки для точек графика.

Полный список значений pch и соответствующих им форм вы можете найти здесь .

Пример 2: Диаграмма рассеяния по группам в ggplot2

Следующий код показывает, как создать диаграмму рассеяния в ggplot2, где точки окрашиваются в зависимости от значения переменной group:

 library (ggplot2)

#create scatterplot with points colored by group
ggplot(df, aes (x, y)) +
  geom_point( aes (color=group))

Обратите внимание, что вы также можете изменить цвет и размер точек на графике:

 library (ggplot2)

#create scatterplot with points colored by group
ggplot(df, aes (x, y)) +
  geom_point( aes (color=group), size= 3 ) +
  scale_color_manual(values=c(' purple ', ' steelblue ')) 

облако точек по группе в R

Обратите внимание, что мы увеличили размер точек с помощью аргумента размера и что цвета точек соответствуют цветам, указанным в аргументе Scale_color_manual() .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи с облаками точек в R:

Как пометить точки на диаграмме рассеяния в R
Как создать диаграмму рассеяния с линией регрессии в R
Как использовать функцию Jitter для облаков точек в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *