Pandas: so setzen sie den index nach der verwendung von dropna() zurück


Sie können die folgende grundlegende Syntax verwenden, um einen Index eines Pandas-DataFrames zurückzusetzen, nachdem Sie die Funktion dropna() verwendet haben, um Zeilen mit fehlenden Werten zu löschen:

 df = df. dropna (). reset_index (drop= True )

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Index in Pandas nach Verwendung von dropna() zurücksetzen

Angenommen, wir haben den folgenden Pandas-DataFrame, der Informationen über verschiedene Basketballspieler enthält:

 import pandas as pd
import numpy as np

#create dataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, np.nan, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, np.nan, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, np.nan, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
1 B NaN 7.0 8.0
2 C 19.0 7.0 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 NaN 5.0
6G 20.0 9.0 NaN
7 H 28.0 4.0 12.0

Nehmen wir nun an, wir verwenden die Funktion dropna() , um alle Zeilen aus dem DataFrame zu entfernen, in denen in einer Spalte ein Wert fehlt:

 #drop rows with nan values in any column
df = df. dropna ()

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
2 C 19.0 7.0 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
7 H 28.0 4.0 12.0

Beachten Sie, dass der Index weiterhin die ursprünglichen Indexwerte für jede Zeile enthält.

Um den Index nach Verwendung der Funktion dropna() zurückzusetzen, können wir die folgende Syntax verwenden:

 #drop rows with nan values in any column
df = df. dropna (). reset_index (drop= True )

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
1 C 19.0 7.0 10.0
2 D 14.0 9.0 6.0
3 E 14.0 12.0 6.0
4 H 28.0 4.0 12.0

Beachten Sie, dass jede Zeile mit fehlenden Werten gelöscht und die Indexwerte zurückgesetzt wurden.

Die Indexwerte liegen jetzt zwischen 0 und 4.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:

So drucken Sie Pandas DataFrame ohne Index
So filtern Sie nach Indexwert in Pandas
So verwenden Sie die erste Spalte als Index in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert