So wählen sie einzelne zeilen in einem pandas dataframe aus
Sie können die folgende Syntax verwenden, um einzelne Zeilen in einem Pandas-DataFrame auszuwählen:
df = df. drop_duplicates ()
Und Sie können die folgende Syntax verwenden, um einzelne Zeilen in bestimmten Spalten in einem Pandas-DataFrame auszuwählen:
df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])
Die folgenden Beispiele zeigen, wie diese Syntax in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:
import pandas as pd #createDataFrame df = pd. DataFrame ({' a ':[4,4,3,8], ' b ': [2, 2, 6, 8], ' c ': [2, 2, 9, 9]}) #view DataFrame df a b c 0 4 2 2 1 4 2 2 2 3 6 9 3 8 8 9
Beispiel 1: Wählen Sie in allen Spalten eindeutige Zeilen aus
Der folgende Code zeigt, wie eindeutige Zeilen in allen Spalten des Pandas DataFrame ausgewählt werden:
#drop duplicates from DataFrame df = df. drop_duplicates () #view DataFrame df a b c 0 4 2 2 2 3 6 9 3 8 8 9
Die erste und zweite Zeile waren Duplikate, daher haben die Pandas die zweite Zeile weggelassen.
Standardmäßig behält die Funktion drop_duplicates() das erste Duplikat bei. Sie können jedoch angeben, dass stattdessen das letzte Duplikat beibehalten werden soll:
#drop duplicates from DataFrame, keep last duplicate df = df. drop_duplicates (keep=' last ') #view DataFrame df a b c 1 4 2 2 2 3 6 9 3 8 8 9
Beispiel 2: Wählen Sie eindeutige Zeilen in bestimmten Spalten aus
Der folgende Code zeigt, wie einzelne Zeilen in der einzelnen „c“-Spalte des DataFrame ausgewählt werden:
#drop duplicates from column 'c' in DataFrame df = df. drop_duplicates (subset=[' c ']) #view DataFrame df a b c 0 4 2 2 2 3 6 9
Zwei Zeilen wurden aus dem DataFrame entfernt.
Zusätzliche Ressourcen
So wählen Sie Zeilen nach Index in einem Pandas DataFrame aus
So erhalten Sie Zeilennummern in einem Pandas DataFrame
So finden Sie eindeutige Werte in einer Spalte in Pandas