Panda: come reimpostare l'indice dopo aver utilizzato dropna()


È possibile utilizzare la seguente sintassi di base per reimpostare un indice di un DataFrame panda dopo aver utilizzato la funzione dropna() per eliminare le righe con valori mancanti:

 df = df. dropna (). reset_index (drop= True )

L’esempio seguente mostra come utilizzare questa sintassi nella pratica.

Esempio: reimposta l’indice in Panda dopo aver utilizzato dropna()

Supponiamo di avere il seguente DataFrame panda che contiene informazioni su vari giocatori di basket:

 import pandas as pd
import numpy as np

#create dataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, np.nan, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, np.nan, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, np.nan, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
1 B NaN 7.0 8.0
2 C 19.0 7.0 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 NaN 5.0
6G 20.0 9.0 NaN
7 H 28.0 4.0 12.0

Supponiamo ora di utilizzare la funzione dropna() per rimuovere tutte le righe dal DataFrame che hanno un valore mancante in una colonna:

 #drop rows with nan values in any column
df = df. dropna ()

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
2 C 19.0 7.0 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
7 H 28.0 4.0 12.0

Tieni presente che l’indice contiene ancora i valori dell’indice originale per ogni riga.

Per reimpostare l’indice dopo aver utilizzato la funzione dropna() , possiamo utilizzare la seguente sintassi:

 #drop rows with nan values in any column
df = df. dropna (). reset_index (drop= True )

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
1 C 19.0 7.0 10.0
2 D 14.0 9.0 6.0
3 E 14.0 12.0 6.0
4 H 28.0 4.0 12.0

Tieni presente che ciascuna delle righe con valori mancanti è stata eliminata e i valori dell’indice sono stati reimpostati.

I valori dell’indice ora vanno da 0 a 4.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:

Come stampare Pandas DataFrame senza indice
Come filtrare per valore di indice in Pandas
Come utilizzare la prima colonna come indice in Pandas

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *