Как создать пузырьковую диаграмму в r
Пузырьковая диаграмма — это тип диаграммы, который позволяет одновременно визуализировать три переменные в наборе данных.
Первые две переменные используются как координаты (x,y) на диаграмме рассеяния, а третья переменная используется для представления размера.
Вы можете использовать следующий базовый синтаксис для создания пузырьковой диаграммы в R:
library (ggplot2) #create bubble chart ggplot(df, aes(x=x_var, y=y_var, size=size_var)) + geom_point(alpha= 0.5 ) + scale_size(range=c( 2 , 10 ), name=' Legend Name ')
В следующем примере показано, как использовать этот синтаксис для создания пузырьковой диаграммы на практике.
Примечание . Аргумент альфа указывает, что круги на диаграмме должны быть частично прозрачными. Аргумент range позволяет установить минимальное и максимальное значения радиуса кругов на диаграмме.
Пример. Создание пузырьковой диаграммы в R
Предположим, у нас есть следующий кадр данных в R, содержащий информацию о различных баскетболистах:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'), points=c(8, 11, 13, 13, 15, 18, 22, 27, 32), assists=c(4, 3, 6, 5, 4, 7, 8, 11, 6), minutes=c(9, 12, 15, 20, 36, 30, 31, 40, 43)) #view data frame df team points assists minutes 1 To 8 4 9 2 A 11 3 12 3 A 13 6 15 4 B 13 5 20 5 B 15 4 36 6 B 18 7 30 7 C 22 8 31 8 C 27 11 40 9 C 32 6 43
Мы можем использовать следующий синтаксис для создания пузырьковой диаграммы, которая отображает подсказки по оси X, точки по оси Y и использует минуты для определения размера кругов:
library (ggplot2) #create bubble chart ggplot(df, aes(x=assists, y=points, size=minutes)) + geom_point(alpha= 0.5 ) + scale_size(range=c( 2,10 ), name =' Minutes Played ')
Вы можете изменить цвет всех кругов, используя аргумент цвета в функции geom_point() :
library (ggplot2) #create bubble chart with blue circles ggplot(df, aes(x=assists, y=points, size=minutes)) + geom_point(alpha= 0.5 , color=' steelblue ') + scale_size(range=c( 2,10 ), name =' Minutes Played ')
Альтернативно вы можете использовать аргумент цвета в aes() , чтобы установить цвет каждого круга на основе значения другой переменной во фрейме данных:
library (ggplot2) #create bubble chart and color circles based on value of team variable ggplot(df, aes(x=assists, y=points, size=minutes, color=team)) + geom_point(alpha= 0.5 ) + scale_size(range=c( 2,10 ), name =' Minutes Played ')
Цвет каждого круга на графике теперь зависит от значения переменной команды .
Примечание . Не стесняйтесь экспериментировать с минимальными и максимальными значениями аргумента диапазона , чтобы увеличить или уменьшить размер кругов на графике.
Дополнительные ресурсы
В следующих руководствах объясняется, как создавать другие распространенные графики в R:
Как создать диаграмму Парето в R
Как построить несколько линий на графике в R
Как построить несколько коробчатых диаграмм на одном графике в R