Як створити бульбашкову діаграму в r
Бульбашкова діаграма – це тип діаграми, який дозволяє візуалізувати три змінні в наборі даних одночасно.
Перші дві змінні використовуються як координати (x,y) на діаграмі розсіювання, а третя змінна використовується для представлення розміру.
Для створення бульбашкової діаграми в R можна використати такий базовий синтаксис:
library (ggplot2) #create bubble chart ggplot(df, aes(x=x_var, y=y_var, size=size_var)) + geom_point(alpha= 0.5 ) + scale_size(range=c( 2 , 10 ), name=' Legend Name ')
У наступному прикладі показано, як використовувати цей синтаксис для створення бульбашкової діаграми на практиці.
Примітка : аргумент альфа вказує, що кола на діаграмі мають бути частково прозорими. Аргумент діапазону дозволяє встановити мінімальне і максимальне значення радіуса для кіл на діаграмі.
Приклад: створення бульбашкової діаграми в R
Припустимо, у R є наступний кадр даних, який містить інформацію про різних баскетболістів:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'), points=c(8, 11, 13, 13, 15, 18, 22, 27, 32), assists=c(4, 3, 6, 5, 4, 7, 8, 11, 6), minutes=c(9, 12, 15, 20, 36, 30, 31, 40, 43)) #view data frame df team points assists minutes 1 To 8 4 9 2 A 11 3 12 3 A 13 6 15 4 B 13 5 20 5 B 15 4 36 6 B 18 7 30 7 C 22 8 31 8 C 27 11 40 9 C 32 6 43
Ми можемо використати такий синтаксис, щоб створити бульбашкову діаграму, яка відображає підказки на осі X, точки на осі Y і використовує хвилини для визначення розміру кіл:
library (ggplot2) #create bubble chart ggplot(df, aes(x=assists, y=points, size=minutes)) + geom_point(alpha= 0.5 ) + scale_size(range=c( 2,10 ), name =' Minutes Played ')
Ви можете змінити колір усіх кіл за допомогою аргументу color у функції geom_point() :
library (ggplot2) #create bubble chart with blue circles ggplot(df, aes(x=assists, y=points, size=minutes)) + geom_point(alpha= 0.5 , color=' steelblue ') + scale_size(range=c( 2,10 ), name =' Minutes Played ')
Крім того, ви можете використовувати аргумент color у aes() , щоб установити колір кожного кола на основі значення іншої змінної у фреймі даних:
library (ggplot2) #create bubble chart and color circles based on value of team variable ggplot(df, aes(x=assists, y=points, size=minutes, color=team)) + geom_point(alpha= 0.5 ) + scale_size(range=c( 2,10 ), name =' Minutes Played ')
Колір кожного кола на графіку тепер залежить від значення командної змінної.
Примітка : Ви можете грати з мінімальними та максимальними значеннями в аргументі діапазону , щоб збільшити або зменшити розмір кіл на графіку.
Додаткові ресурси
У наступних посібниках пояснюється, як створювати інші типові графіки в R:
Як створити діаграму Парето в R
Як побудувати кілька ліній на графіку в R
Як побудувати кілька коробкових графіків на одному графіку в R