Hoe u een bellendiagram maakt in r
Een bellendiagram is een soort diagram waarmee u drie variabelen tegelijkertijd in een gegevensset kunt visualiseren.
De eerste twee variabelen worden gebruikt als (x,y)-coördinaten op een spreidingsdiagram en de derde variabele wordt gebruikt om de grootte weer te geven.
U kunt de volgende basissyntaxis gebruiken om een bellendiagram in R te maken:
library (ggplot2) #create bubble chart ggplot(df, aes(x=x_var, y=y_var, size=size_var)) + geom_point(alpha= 0.5 ) + scale_size(range=c( 2 , 10 ), name=' Legend Name ')
Het volgende voorbeeld laat zien hoe u deze syntaxis kunt gebruiken om in de praktijk een bellendiagram te maken.
Opmerking : het alpha- argument geeft aan dat de cirkels in het diagram gedeeltelijk transparant moeten zijn. Met het bereikargument kunt u de minimale en maximale straalwaarden voor de cirkels in het diagram instellen.
Voorbeeld: Maak een bellendiagram in R
Stel dat we het volgende dataframe in R hebben dat informatie bevat over verschillende basketbalspelers:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'), points=c(8, 11, 13, 13, 15, 18, 22, 27, 32), assists=c(4, 3, 6, 5, 4, 7, 8, 11, 6), minutes=c(9, 12, 15, 20, 36, 30, 31, 40, 43)) #view data frame df team points assists minutes 1 To 8 4 9 2 A 11 3 12 3 A 13 6 15 4 B 13 5 20 5 B 15 4 36 6 B 18 7 30 7 C 22 8 31 8 C 27 11 40 9 C 32 6 43
We kunnen de volgende syntaxis gebruiken om een bellendiagram te maken dat hulpmiddelen op de x-as en punten op de y-as weergeeft, en minuten gebruikt om de grootte van de cirkels te bepalen:
library (ggplot2) #create bubble chart ggplot(df, aes(x=assists, y=points, size=minutes)) + geom_point(alpha= 0.5 ) + scale_size(range=c( 2,10 ), name =' Minutes Played ')
Je kunt de kleur van alle cirkels wijzigen met behulp van het color- argument in de functie geom_point() :
library (ggplot2) #create bubble chart with blue circles ggplot(df, aes(x=assists, y=points, size=minutes)) + geom_point(alpha= 0.5 , color=' steelblue ') + scale_size(range=c( 2,10 ), name =' Minutes Played ')
Als alternatief kunt u het kleurargument in aes() gebruiken om de kleur van elke cirkel in te stellen op basis van de waarde van een andere variabele in het dataframe:
library (ggplot2) #create bubble chart and color circles based on value of team variable ggplot(df, aes(x=assists, y=points, size=minutes, color=team)) + geom_point(alpha= 0.5 ) + scale_size(range=c( 2,10 ), name =' Minutes Played ')
De kleur van elke cirkel in de plot hangt nu af van de waarde van de teamvariabele .
Opmerking : speel gerust met de minimum- en maximumwaarden in het bereikargument om de grootte van de cirkels in de plot te vergroten of verkleinen.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelgebruikte grafieken in R kunt maken:
Hoe u een Pareto-diagram maakt in R
Hoe meerdere lijnen in een grafiek te plotten in R
Hoe meerdere boxplots in één grafiek in R te plotten