Como criar um gráfico de bolhas em r


Um gráfico de bolhas é um tipo de gráfico que permite visualizar três variáveis em um conjunto de dados simultaneamente.

As duas primeiras variáveis são usadas como coordenadas (x,y) em um gráfico de dispersão e a terceira variável é usada para representar o tamanho.

Você pode usar a seguinte sintaxe básica para criar um gráfico de bolhas em R:

 library (ggplot2)

#create bubble chart
ggplot(df, aes(x=x_var, y=y_var, size=size_var)) +
  geom_point(alpha= 0.5 ) +
  scale_size(range=c( 2 , 10 ), name=' Legend Name ')

O exemplo a seguir mostra como usar essa sintaxe para criar um gráfico de bolhas na prática.

Nota : O argumento alfa especifica que os círculos no gráfico devem ser parcialmente transparentes. O argumento range permite definir os valores mínimo e máximo do raio dos círculos no gráfico.

Exemplo: Crie um gráfico de bolhas em R

Suponha que temos o seguinte quadro de dados em R que contém informações sobre vários jogadores de basquete:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'),
                 points=c(8, 11, 13, 13, 15, 18, 22, 27, 32),
                 assists=c(4, 3, 6, 5, 4, 7, 8, 11, 6),
                 minutes=c(9, 12, 15, 20, 36, 30, 31, 40, 43))

#view data frame
df

  team points assists minutes
1 To 8 4 9
2 A 11 3 12
3 A 13 6 15
4 B 13 5 20
5 B 15 4 36
6 B 18 7 30
7 C 22 8 31
8 C 27 11 40
9 C 32 6 43

Podemos usar a seguinte sintaxe para criar um gráfico de bolhas que exibe ajuda no eixo x, pontos no eixo y e usa minutos para determinar o tamanho dos círculos:

 library (ggplot2)

#create bubble chart
ggplot(df, aes(x=assists, y=points, size=minutes)) +
  geom_point(alpha= 0.5 ) +
  scale_size(range=c( 2,10 ), name =' Minutes Played ')

Você pode alterar a cor de todos os círculos usando o argumento color na função geom_point() :

 library (ggplot2)

#create bubble chart with blue circles
ggplot(df, aes(x=assists, y=points, size=minutes)) +
  geom_point(alpha= 0.5 , color=' steelblue ') +
  scale_size(range=c( 2,10 ), name =' Minutes Played ') 

gráfico de bolhas em R

Alternativamente, você pode usar o argumento color em aes() para definir a cor de cada círculo com base no valor de outra variável no quadro de dados:

 library (ggplot2)

#create bubble chart and color circles based on value of team variable
ggplot(df, aes(x=assists, y=points, size=minutes, color=team)) +
  geom_point(alpha= 0.5 ) +
  scale_size(range=c( 2,10 ), name =' Minutes Played ') 

gráfico de bolhas em R com cor baseada na condição

A cor de cada círculo no gráfico agora depende do valor da variável equipe .

Nota : Sinta-se à vontade para brincar com os valores mínimo e máximo no argumento range para aumentar ou diminuir o tamanho dos círculos no gráfico.

Recursos adicionais

Os tutoriais a seguir explicam como criar outros gráficos comuns em R:

Como criar um gráfico de Pareto em R
Como traçar múltiplas linhas em um gráfico em R
Como plotar vários boxplots em um único gráfico em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *