Hoe rbind te gebruiken in python (equivalent aan r)
De rbind- functie in R, een afkorting van row-bind , kan worden gebruikt om dataframes samen te combineren op basis van hun rijen.
We kunnen de functie pandas concat() gebruiken om de equivalente functie in Python uit te voeren:
df3 = pd. concat ([df1, df2])
De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld 1: Gebruik rbind in Python met gelijke kolommen
Laten we aannemen dat we de volgende twee panda-dataframes hebben:
import pandas as pd #define DataFrames df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'], ' points ': [99, 91, 104, 88, 108]}) print (df1) team points 0 to 99 1 B 91 2 C 104 3 D 88 4 E 108 df2 = pd. DataFrame ({' assists ': ['F', 'G', 'H', 'I', 'J'], ' rebounds ': [91, 88, 85, 87, 95]}) print (df2) team points 0 F 91 1 G 88 2:85 3 I 87 4 days 95
We kunnen de functie concat() gebruiken om deze twee DataFrames snel aan elkaar te koppelen via hun regels:
#row-bind two DataFrames
df3 = pd. concat ([df1, df2])
#view resulting DataFrame
df3
team points
0 to 99
1 B 91
2 C 104
3 D 88
4 E 108
0 F 91
1 G 88
2:85
3 I 87
4 days 95
Merk op dat we reset_index() ook kunnen gebruiken om de indexwaarden van het nieuwe DataFrame opnieuw in te stellen:
#row-bind two DataFrames and reset index values
df3 = pd. concat ([df1, df2]). reset_index (drop= True )
#view resulting DataFrame
df3
team points
0 to 99
1 B 91
2 C 104
3 D 88
4 E 108
5 F 91
6 G 88
7:85 a.m.
8 I 87
9 D 95
Voorbeeld 2: rbind gebruiken in Python met ongelijke kolommen
We kunnen ook de functie concat() gebruiken om twee DataFrames met een ongelijk aantal kolommen aan elkaar te koppelen en eventuele ontbrekende waarden worden eenvoudigweg gevuld met NaN:
import pandas as pd #define DataFrames df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'], ' points ': [99, 91, 104, 88, 108]}) df2 = pd. DataFrame ({' team ': ['F', 'G', 'H', 'I', 'J'], ' points ': [91, 88, 85, 87, 95], ' rebounds ': [24, 27, 27, 30, 35]}) #row-bind two DataFrames df3 = pd. concat ([df1, df2]). reset_index (drop= True ) #view resulting DataFrame df3 team points rebounds 0 to 99 NaN 1 B 91 NaN 2 C 104 NaN 3 D 88 NaN 4 E 108 NaN 5 F 91 24.0 6G 88 27.0 7:85 AM 27.0 8 I 87 30.0 9 D 95 35.0
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende functies in Python kunt uitvoeren:
Hoe cbind te gebruiken in Python (equivalent aan R)
Hoe u een VLOOKUP uitvoert in Panda’s
Hoe rijen met een specifieke waarde in Pandas te verwijderen