Hoe de indexkolom in panda's te verwijderen (met voorbeelden)


Soms wilt u misschien de indexkolom verwijderen uit een panda’s DataFrame in Python.

Omdat panda’s DataFrames en Series altijd een index hebben, kunt u de index niet daadwerkelijk verwijderen , maar kunt u deze opnieuw instellen met behulp van het volgende stukje code:

 df. reset_index (drop= True , place= True )

Stel dat we bijvoorbeeld de volgende panda’s DataFrame hebben met een letterindex:

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'points': [25, 12, 15, 14, 19, 23, 25, 29],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#set index of DataFrame to be random letters
df = df. set_index ([pd. Index (['a', 'b', 'd', 'g', 'h', 'm', 'n', 'z'])])

#display DataFrame
df

        points assists rebounds
a 25 5 11
b 12 7 8
d 15 7 10
g 14 9 6
h 19 12 6
m 23 9 5
n 25 9 9
z 29 4 12

We kunnen de functie reset_index() gebruiken om de index opnieuw in te stellen, zodat deze een opeenvolgende lijst met getallen is:

 #reset indexes
df. reset_index (drop= True , place= True )

#display DataFrame
df

        points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6
5 23 9 5
6 25 9 9
7 29 4 12

Merk op dat de index nu een lijst met getallen van 0 tot 7 is.

Zoals eerder vermeld, is de index eigenlijk geen kolom. Dus als we de opdracht shape gebruiken, zien we dat het DataFrame 8 rijen en 3 kolommen heeft (in plaats van 4 kolommen):

 #find number of rows and columns in DataFrame
df. shape

(8, 3)

Bonus: verwijder de index bij het importeren en exporteren

Vaak wilt u misschien de index van een panda’s DataFrame opnieuw instellen nadat u deze uit een CSV-bestand hebt gelezen. U kunt de index snel opnieuw instellen wanneer u deze importeert met behulp van het volgende stukje code:

 df = pd. read_csv ('data.csv', index_col= False )

En u kunt ervoor zorgen dat er tijdens het exporteren geen indexkolom naar een CSV-bestand wordt geschreven door het volgende stukje code te gebruiken:

 df. to_csv ('data.csv', index= False )

Aanvullende bronnen

Hoe u een kolom instelt als index in Pandas
Hoe rijen met NaN-waarden in Panda’s te verwijderen
Hoe waarden in een Pandas DataFrame te sorteren

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert