Panda's: hoe de index opnieuw in te stellen na het gebruik van dropna()


U kunt de volgende basissyntaxis gebruiken om een index van een panda’s DataFrame opnieuw in te stellen nadat u de functie dropna() hebt gebruikt om rijen met ontbrekende waarden te verwijderen:

 df = df. dropna (). reset_index (drop= True )

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: index in Panda’s opnieuw instellen na gebruik van dropna()

Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over verschillende basketbalspelers:

 import pandas as pd
import numpy as np

#create dataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, np.nan, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, np.nan, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, np.nan, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
1 B NaN 7.0 8.0
2 C 19.0 7.0 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 NaN 5.0
6G 20.0 9.0 NaN
7 H 28.0 4.0 12.0

Stel nu dat we de functie dropna() gebruiken om alle rijen uit het DataFrame te verwijderen die een ontbrekende waarde in een kolom hebben:

 #drop rows with nan values in any column
df = df. dropna ()

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
2 C 19.0 7.0 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
7 H 28.0 4.0 12.0

Merk op dat de index nog steeds de originele indexwaarden voor elke rij bevat.

Om de index opnieuw in te stellen na gebruik van de dropna()- functie, kunnen we de volgende syntaxis gebruiken:

 #drop rows with nan values in any column
df = df. dropna (). reset_index (drop= True )

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
1 C 19.0 7.0 10.0
2 D 14.0 9.0 6.0
3 E 14.0 12.0 6.0
4 H 28.0 4.0 12.0

Merk op dat elk van de rijen met ontbrekende waarden is verwijderd en dat de indexwaarden opnieuw zijn ingesteld.

Indexwaarden variëren nu van 0 tot 4.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Hoe Pandas DataFrame af te drukken zonder index
Hoe te filteren op indexwaarde in Pandas
Hoe de eerste kolom als index in Pandas te gebruiken

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert