Come selezionare singole righe in un pandas dataframe
È possibile utilizzare la seguente sintassi per selezionare singole righe in un DataFrame panda:
df = df. drop_duplicates ()
E puoi utilizzare la seguente sintassi per selezionare singole righe in colonne specifiche in un DataFrame panda:
df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])
I seguenti esempi mostrano come utilizzare questa sintassi in pratica con i seguenti DataFrame panda:
import pandas as pd #createDataFrame df = pd. DataFrame ({' a ':[4,4,3,8], ' b ': [2, 2, 6, 8], ' c ': [2, 2, 9, 9]}) #view DataFrame df a b c 0 4 2 2 1 4 2 2 2 3 6 9 3 8 8 9
Esempio 1: seleziona righe univoche in tutte le colonne
Il codice seguente mostra come selezionare righe univoche in tutte le colonne del DataFrame panda:
#drop duplicates from DataFrame df = df. drop_duplicates () #view DataFrame df a b c 0 4 2 2 2 3 6 9 3 8 8 9
La prima e la seconda riga erano duplicate, quindi i panda hanno eliminato la seconda riga.
Per impostazione predefinita, la funzione drop_duplicates() manterrà il primo duplicato. Tuttavia, puoi specificare di conservare invece l’ultimo duplicato:
#drop duplicates from DataFrame, keep last duplicate df = df. drop_duplicates (keep=' last ') #view DataFrame df a b c 1 4 2 2 2 3 6 9 3 8 8 9
Esempio 2: seleziona righe univoche in colonne specifiche
Il codice seguente mostra come selezionare singole righe nella singola colonna “c” del DataFrame:
#drop duplicates from column 'c' in DataFrame df = df. drop_duplicates (subset=[' c ']) #view DataFrame df a b c 0 4 2 2 2 3 6 9
Due righe sono state rimosse dal DataFrame.
Risorse addizionali
Come selezionare le righe per indice in un Pandas DataFrame
Come ottenere i numeri di riga in un Pandas DataFrame
Come trovare valori univoci in una colonna in Pandas