Come selezionare singole righe in un pandas dataframe


È possibile utilizzare la seguente sintassi per selezionare singole righe in un DataFrame panda:

 df = df. drop_duplicates ()

E puoi utilizzare la seguente sintassi per selezionare singole righe in colonne specifiche in un DataFrame panda:

 df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])

I seguenti esempi mostrano come utilizzare questa sintassi in pratica con i seguenti DataFrame panda:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' a ':[4,4,3,8],
                   ' b ': [2, 2, 6, 8],
                   ' c ': [2, 2, 9, 9]})

#view DataFrame
df

	a b c
0 4 2 2
1 4 2 2
2 3 6 9
3 8 8 9

Esempio 1: seleziona righe univoche in tutte le colonne

Il codice seguente mostra come selezionare righe univoche in tutte le colonne del DataFrame panda:

 #drop duplicates from DataFrame
df = df. drop_duplicates ()

#view DataFrame
df

	a b c
0 4 2 2
2 3 6 9
3 8 8 9

La prima e la seconda riga erano duplicate, quindi i panda hanno eliminato la seconda riga.

Per impostazione predefinita, la funzione drop_duplicates() manterrà il primo duplicato. Tuttavia, puoi specificare di conservare invece l’ultimo duplicato:

 #drop duplicates from DataFrame, keep last duplicate
df = df. drop_duplicates (keep=' last ')

#view DataFrame
df

	a b c
1 4 2 2
2 3 6 9
3 8 8 9

Esempio 2: seleziona righe univoche in colonne specifiche

Il codice seguente mostra come selezionare singole righe nella singola colonna “c” del DataFrame:

 #drop duplicates from column 'c' in DataFrame
df = df. drop_duplicates (subset=[' c '])

#view DataFrame
df
	a b c
0 4 2 2
2 3 6 9

Due righe sono state rimosse dal DataFrame.

Risorse addizionali

Come selezionare le righe per indice in un Pandas DataFrame
Come ottenere i numeri di riga in un Pandas DataFrame
Come trovare valori univoci in una colonna in Pandas

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *