Hoe u een plot in ggplot2 maakt met behulp van meerdere dataframes


U kunt de volgende basissyntaxis gebruiken om een plot in ggplot2 te maken met behulp van meerdere dataframes:

 library (ggplot2)

ggplot() + 
  geom_line(data=df1, aes(x=x_var, y=y_var), color=' blue ') + 
  geom_line(data=df2, aes(x=x_var, y=y_var), color=' red ')

In dit specifieke voorbeeld worden meerdere lijnen in één plot in ggplot2 uitgezet met behulp van gegevens uit twee verschillende dataframes.

Door dataframenamen op geom()- niveau op te geven, kunnen we gegevens uit meerdere dataframes in één plot opnemen.

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: maak een plot in ggplot2 met behulp van meerdere dataframes

Stel dat we de volgende twee dataframes in R hebben die informatie bevatten over de totale omzet in twee verschillende winkels op verschillende dagen:

 #create first data frame
df1 <- data. frame (day=1:8,
                  sales=c(6, 8, 9, 14, 13, 13, 7, 10))

df1

  day sales
1 1 6
2 2 8
3 3 9
4 4 14
5 5 13
6 6 13
7 7 7
8 8 10

#create second data frame
df2 <- data. frame (day=1:8,
                  sales=c(2, 3, 3, 5, 7, 6, 5, 9))

df2

  day sales
1 1 2
2 2 3
3 3 3
4 4 5
5 5 7
6 6 6
7 7 5
8 8 9

We kunnen de volgende syntaxis gebruiken om een plot in ggplot2 te maken met meerdere rijen om de winkelverkopen in beide dataframes weer te geven:

 library (ggplot2)

#create line plot using multiple data frames
ggplot() + 
  geom_line(data=df1, aes(x=day, y=sales), color=' steelblue ') + 
  geom_line(data=df2, aes(x=day, y=sales), color=' coral2 ') 

ggplot2 meerdere dataframes

De blauwe lijn vertegenwoordigt de waarden van het datablok genaamd df1 en de rode lijn vertegenwoordigt de waarden van het datablok genaamd df2 .

Merk op dat deze methode ook werkt met andere geom()- functies.

We kunnen bijvoorbeeld het volgende spreidingsdiagram maken om de verkopen per winkel uit elk dataframe weer te geven:

 library (ggplot2)

#create scatter plot using multiple data frames
ggplot() + 
  geom_point(data=df1, aes(x=day, y=sales), color=' steelblue ') + 
  geom_point(data=df2, aes(x=day, y=sales), color=' coral2 ') 

De blauwe stippen vertegenwoordigen de waarden van het datablok genaamd df1 en de rode stippen vertegenwoordigen de waarden van het datablok genaamd df2 .

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in ggplot2 kunt uitvoeren:

Hoe meerdere lijnen in ggplot2 te plotten
Hoe legendalabels in ggplot2 te veranderen
Hoe X-aslabels in ggplot2 te veranderen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert