Hoe u een plot in ggplot2 maakt met behulp van meerdere dataframes
U kunt de volgende basissyntaxis gebruiken om een plot in ggplot2 te maken met behulp van meerdere dataframes:
library (ggplot2) ggplot() + geom_line(data=df1, aes(x=x_var, y=y_var), color=' blue ') + geom_line(data=df2, aes(x=x_var, y=y_var), color=' red ')
In dit specifieke voorbeeld worden meerdere lijnen in één plot in ggplot2 uitgezet met behulp van gegevens uit twee verschillende dataframes.
Door dataframenamen op geom()- niveau op te geven, kunnen we gegevens uit meerdere dataframes in één plot opnemen.
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: maak een plot in ggplot2 met behulp van meerdere dataframes
Stel dat we de volgende twee dataframes in R hebben die informatie bevatten over de totale omzet in twee verschillende winkels op verschillende dagen:
#create first data frame df1 <- data. frame (day=1:8, sales=c(6, 8, 9, 14, 13, 13, 7, 10)) df1 day sales 1 1 6 2 2 8 3 3 9 4 4 14 5 5 13 6 6 13 7 7 7 8 8 10 #create second data frame df2 <- data. frame (day=1:8, sales=c(2, 3, 3, 5, 7, 6, 5, 9)) df2 day sales 1 1 2 2 2 3 3 3 3 4 4 5 5 5 7 6 6 6 7 7 5 8 8 9
We kunnen de volgende syntaxis gebruiken om een plot in ggplot2 te maken met meerdere rijen om de winkelverkopen in beide dataframes weer te geven:
library (ggplot2) #create line plot using multiple data frames ggplot() + geom_line(data=df1, aes(x=day, y=sales), color=' steelblue ') + geom_line(data=df2, aes(x=day, y=sales), color=' coral2 ')
De blauwe lijn vertegenwoordigt de waarden van het datablok genaamd df1 en de rode lijn vertegenwoordigt de waarden van het datablok genaamd df2 .
Merk op dat deze methode ook werkt met andere geom()- functies.
We kunnen bijvoorbeeld het volgende spreidingsdiagram maken om de verkopen per winkel uit elk dataframe weer te geven:
library (ggplot2) #create scatter plot using multiple data frames ggplot() + geom_point(data=df1, aes(x=day, y=sales), color=' steelblue ') + geom_point(data=df2, aes(x=day, y=sales), color=' coral2 ')
De blauwe stippen vertegenwoordigen de waarden van het datablok genaamd df1 en de rode stippen vertegenwoordigen de waarden van het datablok genaamd df2 .
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in ggplot2 kunt uitvoeren:
Hoe meerdere lijnen in ggplot2 te plotten
Hoe legendalabels in ggplot2 te veranderen
Hoe X-aslabels in ggplot2 te veranderen