Как создать облака точек по группам в r (2 примера)
Для создания диаграммы рассеяния на основе кластеров в R можно использовать следующие методы:
Метод 1: используйте базу R
plot(df$x, df$y, col=as. factor (df$group))
Способ 2: используйте ggplot2
library (ggplot2)
ggplot(df, aes (x, y)) +
geom_point( aes (color=group))
Следующие примеры показывают, как использовать каждый метод на практике со следующим фреймом данных:
#create data frame
df <- data. frame (x=c(1, 2, 2, 3, 5, 6, 7),
y=c(4, 8, 7, 9, 15, 14, 20),
group=c('A', 'A', 'A', 'B', 'B', 'B', 'B'))
#view data frame
df
xy group
1 1 4 A
2 2 8 A
3 2 7 A
4 3 9 B
5 5 15 B
6 6 14 B
7 7 20 B
Пример 1: облако точек по группам в базе R
Следующий код показывает, как создать облако точек в базе R, где точки окрашены в соответствии со значением переменной group:
#create scatterplot with points colored by group plot(df$x, df$y, col=as. factor (df$group), pch= 19 )
Цвет каждой точки отражает значение переменной «группа» во фрейме данных.
Точки со значением «группы» A отображаются черным цветом, а точки со значением «группы» B отображаются красным.
Обратите внимание, что pch=19 указывает R использовать сплошные кружки для точек графика.
Полный список значений pch и соответствующих им форм вы можете найти здесь .
Пример 2: Диаграмма рассеяния по группам в ggplot2
Следующий код показывает, как создать диаграмму рассеяния в ggplot2, где точки окрашиваются в зависимости от значения переменной group:
library (ggplot2) #create scatterplot with points colored by group ggplot(df, aes (x, y)) + geom_point( aes (color=group))
Обратите внимание, что вы также можете изменить цвет и размер точек на графике:
library (ggplot2) #create scatterplot with points colored by group ggplot(df, aes (x, y)) + geom_point( aes (color=group), size= 3 ) + scale_color_manual(values=c(' purple ', ' steelblue '))
Обратите внимание, что мы увеличили размер точек с помощью аргумента размера и что цвета точек соответствуют цветам, указанным в аргументе Scale_color_manual() .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи с облаками точек в R:
Как пометить точки на диаграмме рассеяния в R
Как создать диаграмму рассеяния с линией регрессии в R
Как использовать функцию Jitter для облаков точек в R