Hoe u een kolom invoegt in een pandas dataframe
Vaak wilt u misschien een nieuwe kolom invoegen in een Pandas DataFrame. Gelukkig is dit eenvoudig te doen met de pandas insert() functie, die de volgende syntaxis gebruikt:
insert(loc, kolom, waarde, allow_duplicates=False)
Goud:
- loc: index waarin de kolom moet worden ingevoegd. De eerste kolom is 0.
- kolom: Naam die aan de nieuwe kolom moet worden gegeven.
- waarde: Array met waarden voor de nieuwe kolom.
- allow_duplicates: of de nieuwe kolomnaam al dan niet overeenkomt met de bestaande kolomnaam. De standaardwaarde is Onwaar.
Deze tutorial toont verschillende voorbeelden van praktisch gebruik van deze functie.
Voorbeeld 1: Voeg een nieuwe kolom in als eerste kolom
De volgende code laat zien hoe u een nieuwe kolom invoegt als de eerste kolom van een bestaand DataFrame:
import pandas as pd #createDataFrame df = pd.DataFrame({'points': [25, 12, 15, 14, 19], 'assists': [5, 7, 7, 9, 12], 'rebounds': [11, 8, 10, 6, 6]}) #view DataFrame df points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6 #insert new column 'player' as first column player_vals = ['A', 'B', 'C', 'D', 'E'] df. insert (loc= 0 , column='player', value=player_vals) df player points assists rebounds 0 to 25 5 11 1 B 12 7 8 2 C 15 7 10 3 D 14 9 6 4 E 19 12 6
Voorbeeld 2: Voeg een nieuwe kolom in als middelste kolom
De volgende code laat zien hoe u een nieuwe kolom invoegt als de derde kolom van een bestaand DataFrame:
import pandas as pd #createDataFrame df = pd.DataFrame({'points': [25, 12, 15, 14, 19], 'assists': [5, 7, 7, 9, 12], 'rebounds': [11, 8, 10, 6, 6]}) #insert new column 'player' as third column player_vals = ['A', 'B', 'C', 'D', 'E'] df. insert (loc= 2 , column='player', value=player_vals) df points assists player rebounds 0 25 5 A 11 1 12 7 B 8 2 15 7 C 10 3 14 9 D 6 4 19 12 E 6
Voorbeeld 3: Voeg een nieuwe kolom in als laatste kolom
De volgende code laat zien hoe u een nieuwe kolom invoegt als de laatste kolom van een bestaand DataFrame:
import pandas as pd #createDataFrame df = pd.DataFrame({'points': [25, 12, 15, 14, 19], 'assists': [5, 7, 7, 9, 12], 'rebounds': [11, 8, 10, 6, 6]}) #insert new column 'player' as last column player_vals = ['A', 'B', 'C', 'D', 'E'] df. insert (loc= len (df.columns) , column='player', value=player_vals) df points assists player rebounds 0 25 5 A 11 1 12 7 B 8 2 15 7 C 10 3 14 9 D 6 4 19 12 E 6
Houd er rekening mee dat u met len(df.columns) een nieuwe kolom kunt invoegen als de laatste kolom van elk dataFrame, ongeacht het aantal kolommen dat deze bevat.
U kunt de volledige documentatie van de functie insert() hier vinden.