Hoe de indexkolom in panda's te verwijderen (met voorbeelden)
Soms wilt u misschien de indexkolom verwijderen uit een panda’s DataFrame in Python.
Omdat panda’s DataFrames en Series altijd een index hebben, kunt u de index niet daadwerkelijk verwijderen , maar kunt u deze opnieuw instellen met behulp van het volgende stukje code:
df. reset_index (drop= True , place= True )
Stel dat we bijvoorbeeld de volgende panda’s DataFrame hebben met een letterindex:
import pandas as pd #createDataFrame df = pd.DataFrame({'points': [25, 12, 15, 14, 19, 23, 25, 29], 'assists': [5, 7, 7, 9, 12, 9, 9, 4], 'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]}) #set index of DataFrame to be random letters df = df. set_index ([pd. Index (['a', 'b', 'd', 'g', 'h', 'm', 'n', 'z'])]) #display DataFrame df points assists rebounds a 25 5 11 b 12 7 8 d 15 7 10 g 14 9 6 h 19 12 6 m 23 9 5 n 25 9 9 z 29 4 12
We kunnen de functie reset_index() gebruiken om de index opnieuw in te stellen, zodat deze een opeenvolgende lijst met getallen is:
#reset indexes df. reset_index (drop= True , place= True ) #display DataFrame df points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6 5 23 9 5 6 25 9 9 7 29 4 12
Merk op dat de index nu een lijst met getallen van 0 tot 7 is.
Zoals eerder vermeld, is de index eigenlijk geen kolom. Dus als we de opdracht shape gebruiken, zien we dat het DataFrame 8 rijen en 3 kolommen heeft (in plaats van 4 kolommen):
#find number of rows and columns in DataFrame df. shape (8, 3)
Bonus: verwijder de index bij het importeren en exporteren
Vaak wilt u misschien de index van een panda’s DataFrame opnieuw instellen nadat u deze uit een CSV-bestand hebt gelezen. U kunt de index snel opnieuw instellen wanneer u deze importeert met behulp van het volgende stukje code:
df = pd. read_csv ('data.csv', index_col= False )
En u kunt ervoor zorgen dat er tijdens het exporteren geen indexkolom naar een CSV-bestand wordt geschreven door het volgende stukje code te gebruiken:
df. to_csv ('data.csv', index= False )
Aanvullende bronnen
Hoe u een kolom instelt als index in Pandas
Hoe rijen met NaN-waarden in Panda’s te verwijderen
Hoe waarden in een Pandas DataFrame te sorteren