Как создать пузырьковую диаграмму в r


Пузырьковая диаграмма — это тип диаграммы, который позволяет одновременно визуализировать три переменные в наборе данных.

Первые две переменные используются как координаты (x,y) на диаграмме рассеяния, а третья переменная используется для представления размера.

Вы можете использовать следующий базовый синтаксис для создания пузырьковой диаграммы в R:

 library (ggplot2)

#create bubble chart
ggplot(df, aes(x=x_var, y=y_var, size=size_var)) +
  geom_point(alpha= 0.5 ) +
  scale_size(range=c( 2 , 10 ), name=' Legend Name ')

В следующем примере показано, как использовать этот синтаксис для создания пузырьковой диаграммы на практике.

Примечание . Аргумент альфа указывает, что круги на диаграмме должны быть частично прозрачными. Аргумент range позволяет установить минимальное и максимальное значения радиуса кругов на диаграмме.

Пример. Создание пузырьковой диаграммы в R

Предположим, у нас есть следующий кадр данных в R, содержащий информацию о различных баскетболистах:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'),
                 points=c(8, 11, 13, 13, 15, 18, 22, 27, 32),
                 assists=c(4, 3, 6, 5, 4, 7, 8, 11, 6),
                 minutes=c(9, 12, 15, 20, 36, 30, 31, 40, 43))

#view data frame
df

  team points assists minutes
1 To 8 4 9
2 A 11 3 12
3 A 13 6 15
4 B 13 5 20
5 B 15 4 36
6 B 18 7 30
7 C 22 8 31
8 C 27 11 40
9 C 32 6 43

Мы можем использовать следующий синтаксис для создания пузырьковой диаграммы, которая отображает подсказки по оси X, точки по оси Y и использует минуты для определения размера кругов:

 library (ggplot2)

#create bubble chart
ggplot(df, aes(x=assists, y=points, size=minutes)) +
  geom_point(alpha= 0.5 ) +
  scale_size(range=c( 2,10 ), name =' Minutes Played ')

Вы можете изменить цвет всех кругов, используя аргумент цвета в функции geom_point() :

 library (ggplot2)

#create bubble chart with blue circles
ggplot(df, aes(x=assists, y=points, size=minutes)) +
  geom_point(alpha= 0.5 , color=' steelblue ') +
  scale_size(range=c( 2,10 ), name =' Minutes Played ') 

пузырьковая диаграмма в R

Альтернативно вы можете использовать аргумент цвета в aes() , чтобы установить цвет каждого круга на основе значения другой переменной во фрейме данных:

 library (ggplot2)

#create bubble chart and color circles based on value of team variable
ggplot(df, aes(x=assists, y=points, size=minutes, color=team)) +
  geom_point(alpha= 0.5 ) +
  scale_size(range=c( 2,10 ), name =' Minutes Played ') 

Пузырьковая диаграмма в R с цветом в зависимости от состояния

Цвет каждого круга на графике теперь зависит от значения переменной команды .

Примечание . Не стесняйтесь экспериментировать с минимальными и максимальными значениями аргумента диапазона , чтобы увеличить или уменьшить размер кругов на графике.

Дополнительные ресурсы

В следующих руководствах объясняется, как создавать другие распространенные графики в R:

Как создать диаграмму Парето в R
Как построить несколько линий на графике в R
Как построить несколько коробчатых диаграмм на одном графике в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *