Pandy: jak zresetować indeks po użyciu dropna()


Możesz użyć poniższej podstawowej składni, aby zresetować indeks ramki DataFrame pandy po użyciu funkcji dropna() w celu usunięcia wierszy z brakującymi wartościami:

 df = df. dropna (). reset_index (drop= True )

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Zresetuj indeks w Pandach po użyciu dropna()

Załóżmy, że mamy następującą ramkę danych pand, która zawiera informacje o różnych koszykarzach:

 import pandas as pd
import numpy as np

#create dataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, np.nan, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, np.nan, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, np.nan, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
1 B NaN 7.0 8.0
2 C 19.0 7.0 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 NaN 5.0
6G 20.0 9.0 NaN
7 H 28.0 4.0 12.0

Załóżmy teraz, że używamy funkcji dropna() do usunięcia wszystkich wierszy z ramki DataFrame, w których brakuje wartości w kolumnie:

 #drop rows with nan values in any column
df = df. dropna ()

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
2 C 19.0 7.0 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
7 H 28.0 4.0 12.0

Należy pamiętać, że indeks nadal zawiera oryginalne wartości indeksu dla każdego wiersza.

Aby zresetować indeks po użyciu funkcji dropna() , możemy zastosować następującą składnię:

 #drop rows with nan values in any column
df = df. dropna (). reset_index (drop= True )

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
1 C 19.0 7.0 10.0
2 D 14.0 9.0 6.0
3 E 14.0 12.0 6.0
4 H 28.0 4.0 12.0

Należy pamiętać, że każdy z wierszy z brakującymi wartościami został usunięty, a wartości indeksów zresetowane.

Wartości indeksów wahają się teraz od 0 do 4.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Jak wydrukować Pandas DataFrame bez pliku indeksowego
Jak filtrować według wartości indeksu w Pandach
Jak używać pierwszej kolumny jako indeksu w Pandach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *