Panda: come reimpostare l'indice dopo aver utilizzato dropna()
È possibile utilizzare la seguente sintassi di base per reimpostare un indice di un DataFrame panda dopo aver utilizzato la funzione dropna() per eliminare le righe con valori mancanti:
df = df. dropna (). reset_index (drop= True )
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: reimposta l’indice in Panda dopo aver utilizzato dropna()
Supponiamo di avere il seguente DataFrame panda che contiene informazioni su vari giocatori di basket:
import pandas as pd import numpy as np #create dataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, np.nan, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, np.nan, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, np.nan, 12]}) #view DataFrame print (df) team points assists rebounds 0 A 18.0 5.0 11.0 1 B NaN 7.0 8.0 2 C 19.0 7.0 10.0 3D 14.0 9.0 6.0 4 E 14.0 12.0 6.0 5 F 11.0 NaN 5.0 6G 20.0 9.0 NaN 7 H 28.0 4.0 12.0
Supponiamo ora di utilizzare la funzione dropna() per rimuovere tutte le righe dal DataFrame che hanno un valore mancante in una colonna:
#drop rows with nan values in any column df = df. dropna () #view updated DataFrame print (df) team points assists rebounds 0 A 18.0 5.0 11.0 2 C 19.0 7.0 10.0 3D 14.0 9.0 6.0 4 E 14.0 12.0 6.0 7 H 28.0 4.0 12.0
Tieni presente che l’indice contiene ancora i valori dell’indice originale per ogni riga.
Per reimpostare l’indice dopo aver utilizzato la funzione dropna() , possiamo utilizzare la seguente sintassi:
#drop rows with nan values in any column df = df. dropna (). reset_index (drop= True ) #view updated DataFrame print (df) team points assists rebounds 0 A 18.0 5.0 11.0 1 C 19.0 7.0 10.0 2 D 14.0 9.0 6.0 3 E 14.0 12.0 6.0 4 H 28.0 4.0 12.0
Tieni presente che ciascuna delle righe con valori mancanti è stata eliminata e i valori dell’indice sono stati reimpostati.
I valori dell’indice ora vanno da 0 a 4.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:
Come stampare Pandas DataFrame senza indice
Come filtrare per valore di indice in Pandas
Come utilizzare la prima colonna come indice in Pandas