Hoe kolommen per index te verwijderen in pandas
U kunt de volgende syntaxis gebruiken om een kolom uit een Panda DataFrame te verwijderen op basis van indexnummer:
#drop first column from DataFrame df. drop ( df.columns [0], axis= 1 , inplace= True )
En u kunt de volgende syntaxis gebruiken om meerdere kolommen uit een Panda DataFrame te verwijderen op basis van indexnummers:
#drop first, second, and fourth column from DataFrame cols = [0, 1, 3] df. drop (df. columns [cols], axis= 1 , inplace= True )
Als uw DataFrame dubbele kolomnamen heeft, kunt u de volgende syntaxis gebruiken om een kolom op indexnummer te verwijderen:
#define list of columns cols = [x for x in range( df.shape [1])] #drop second column collars. remove (1) #view resulting DataFrame df. iloc [:, cols]
De volgende voorbeelden laten zien hoe u in de praktijk kolommen op index kunt neerzetten.
Voorbeeld 1: verwijder een kolom per index
De volgende code laat zien hoe u de eerste kolom uit een Panda’s DataFrame verwijdert:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Lakers', 'Spurs', 'Cavs'], ' first ': ['Dirk', 'Kobe', 'Tim', 'Lebron'], ' last ': ['Nowitzki', 'Bryant', 'Duncan', 'James'], ' points ': [26, 31, 22, 29]}) #drop first column from DataFrame df. drop ( df.columns [0], axis= 1 , inplace= True ) #view resulting dataFrame df first last points 0 Dirk Nowitzki 26 1 Kobe Bryant 31 2 Tim Duncan 22 3 LeBron James 29
Voorbeeld 2: meerdere kolommen per index neerzetten
De volgende code laat zien hoe u meerdere kolommen in een pandas DataFrame op index kunt neerzetten:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Lakers', 'Spurs', 'Cavs'], ' first ': ['Dirk', 'Kobe', 'Tim', 'Lebron'], ' last ': ['Nowitzki', 'Bryant', 'Duncan', 'James'], ' points ': [26, 31, 22, 29]}) #drop first, second and fourth columns from DataFrame cols = [0, 1, 3] df. drop (df. columns [cols], axis= 1 , inplace= True ) #view resulting dataFrame df last 0 Nowitzki 1 Bryant 2 Duncan 3 James
Voorbeeld 3: Een kolom verwijderen op index met duplicaten
De volgende code laat zien hoe u een kolom op indexnummer in een Panda DataFrame verwijdert als er dubbele kolomnamen bestaan:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Lakers', 'Spurs', 'Cavs'],
' last ': ['Nowitzki', 'Bryant', 'Duncan', 'James'],
' last ': ['Nowitzki', 'Bryant', 'Duncan', 'James'],
' points ': [26, 31, 22, 29]},
columns=[' team ', ' last ', ' last ', ' points '])
#define list of columns range
cols = [x for x in range( df.shape [1])]
#remove second column in DataFrame
collars. remove (1)
#view resulting DataFrame
df. iloc [:, cols]
team last points
0 Mavs Nowitzki 26
1 Lakers Bryant 31
2 Spurs Duncan 22
3 Cavs James 29
Aanvullende bronnen
Hoe twee kolommen in Panda’s te combineren
Panda’s: kolommen op naam sorteren
Panda’s: hoe u het verschil tussen twee kolommen kunt vinden
Panda’s: kolommen toevoegen op basis van een voorwaarde