Hoe u een kolom invoegt in een pandas dataframe


Vaak wilt u misschien een nieuwe kolom invoegen in een Pandas DataFrame. Gelukkig is dit eenvoudig te doen met de pandas insert() functie, die de volgende syntaxis gebruikt:

insert(loc, kolom, waarde, allow_duplicates=False)

Goud:

  • loc: index waarin de kolom moet worden ingevoegd. De eerste kolom is 0.
  • kolom: Naam die aan de nieuwe kolom moet worden gegeven.
  • waarde: Array met waarden voor de nieuwe kolom.
  • allow_duplicates: of de nieuwe kolomnaam al dan niet overeenkomt met de bestaande kolomnaam. De standaardwaarde is Onwaar.

Deze tutorial toont verschillende voorbeelden van praktisch gebruik van deze functie.

Voorbeeld 1: Voeg een nieuwe kolom in als eerste kolom

De volgende code laat zien hoe u een nieuwe kolom invoegt als de eerste kolom van een bestaand DataFrame:

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'points': [25, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 9, 12],
                   'rebounds': [11, 8, 10, 6, 6]})

#view DataFrame
df
        points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6

#insert new column 'player' as first column
player_vals = ['A', 'B', 'C', 'D', 'E']
df. insert (loc= 0 , column='player', value=player_vals)
df

        player points assists rebounds
0 to 25 5 11
1 B 12 7 8
2 C 15 7 10
3 D 14 9 6
4 E 19 12 6

Voorbeeld 2: Voeg een nieuwe kolom in als middelste kolom

De volgende code laat zien hoe u een nieuwe kolom invoegt als de derde kolom van een bestaand DataFrame:

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'points': [25, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 9, 12],
                   'rebounds': [11, 8, 10, 6, 6]})

#insert new column 'player' as third column
player_vals = ['A', 'B', 'C', 'D', 'E']
df. insert (loc= 2 , column='player', value=player_vals)
df

        points assists player rebounds
0 25 5 A 11
1 12 7 B 8
2 15 7 C 10
3 14 9 D 6
4 19 12 E 6

Voorbeeld 3: Voeg een nieuwe kolom in als laatste kolom

De volgende code laat zien hoe u een nieuwe kolom invoegt als de laatste kolom van een bestaand DataFrame:

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'points': [25, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 9, 12],
                   'rebounds': [11, 8, 10, 6, 6]})

#insert new column 'player' as last column
player_vals = ['A', 'B', 'C', 'D', 'E']
df. insert (loc= len (df.columns) , column='player', value=player_vals)
df

        points assists player rebounds
0 25 5 A 11
1 12 7 B 8
2 15 7 C 10
3 14 9 D 6
4 19 12 E 6

Houd er rekening mee dat u met len(df.columns) een nieuwe kolom kunt invoegen als de laatste kolom van elk dataFrame, ongeacht het aantal kolommen dat deze bevat.

U kunt de volledige documentatie van de functie insert() hier vinden.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert