Як створити хмару точок за групою в r (2 приклади)
Щоб створити діаграму розсіювання на основі кластера в R, можна використати такі методи:
Спосіб 1: Використовуйте Base R
plot(df$x, df$y, col=as. factor (df$group))
Спосіб 2: використовуйте ggplot2
library (ggplot2)
ggplot(df, aes (x, y)) +
geom_point( aes (color=group))
У наведених нижче прикладах показано, як використовувати кожен метод на практиці з таким кадром даних:
#create data frame
df <- data. frame (x=c(1, 2, 2, 3, 5, 6, 7),
y=c(4, 8, 7, 9, 15, 14, 20),
group=c('A', 'A', 'A', 'B', 'B', 'B', 'B'))
#view data frame
df
xy group
1 1 4 A
2 2 8 A
3 2 7 A
4 3 9 B
5 5 15 B
6 6 14 B
7 7 20 B
Приклад 1: хмара точок за групою в основі R
Наступний код показує, як створити хмару точок у базовому R, де точки розфарбовані відповідно до значення змінної ‘group’:
#create scatterplot with points colored by group plot(df$x, df$y, col=as. factor (df$group), pch= 19 )
Колір кожної точки відображає значення змінної «групи» у кадрі даних.
Точки зі значенням «групи» A відображаються чорним кольором, а точки зі значенням «групи» B відображаються червоним кольором.
Зверніть увагу, що pch=19 говорить R використовувати суцільні кола для точок графіка.
Ви можете знайти повний список значень pch і їх відповідні форми тут .
Приклад 2: діаграма розсіювання за групами в ggplot2
Наступний код показує, як створити діаграму розсіювання в ggplot2, де точки розфарбовуються на основі значення змінної ‘group’:
library (ggplot2) #create scatterplot with points colored by group ggplot(df, aes (x, y)) + geom_point( aes (color=group))
Зауважте, що ви також можете змінити кольори та розмір точок на графіку:
library (ggplot2) #create scatterplot with points colored by group ggplot(df, aes (x, y)) + geom_point( aes (color=group), size= 3 ) + scale_color_manual(values=c(' purple ', ' steelblue '))
Зауважте, що ми збільшили розмір точок за допомогою аргументу size і що кольори точок відповідають кольорам, які ми вказали в аргументі scale_color_manual() .
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші поширені завдання з хмарами точок у R:
Як позначити точки на діаграмі розсіювання в R
Як створити діаграму розсіювання з лінією регресії в R
Як використовувати функцію джиттера для хмар точок у R