So wählen sie einzelne zeilen in einem pandas dataframe aus


Sie können die folgende Syntax verwenden, um einzelne Zeilen in einem Pandas-DataFrame auszuwählen:

 df = df. drop_duplicates ()

Und Sie können die folgende Syntax verwenden, um einzelne Zeilen in bestimmten Spalten in einem Pandas-DataFrame auszuwählen:

 df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])

Die folgenden Beispiele zeigen, wie diese Syntax in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' a ':[4,4,3,8],
                   ' b ': [2, 2, 6, 8],
                   ' c ': [2, 2, 9, 9]})

#view DataFrame
df

	a b c
0 4 2 2
1 4 2 2
2 3 6 9
3 8 8 9

Beispiel 1: Wählen Sie in allen Spalten eindeutige Zeilen aus

Der folgende Code zeigt, wie eindeutige Zeilen in allen Spalten des Pandas DataFrame ausgewählt werden:

 #drop duplicates from DataFrame
df = df. drop_duplicates ()

#view DataFrame
df

	a b c
0 4 2 2
2 3 6 9
3 8 8 9

Die erste und zweite Zeile waren Duplikate, daher haben die Pandas die zweite Zeile weggelassen.

Standardmäßig behält die Funktion drop_duplicates() das erste Duplikat bei. Sie können jedoch angeben, dass stattdessen das letzte Duplikat beibehalten werden soll:

 #drop duplicates from DataFrame, keep last duplicate
df = df. drop_duplicates (keep=' last ')

#view DataFrame
df

	a b c
1 4 2 2
2 3 6 9
3 8 8 9

Beispiel 2: Wählen Sie eindeutige Zeilen in bestimmten Spalten aus

Der folgende Code zeigt, wie einzelne Zeilen in der einzelnen „c“-Spalte des DataFrame ausgewählt werden:

 #drop duplicates from column 'c' in DataFrame
df = df. drop_duplicates (subset=[' c '])

#view DataFrame
df
	a b c
0 4 2 2
2 3 6 9

Zwei Zeilen wurden aus dem DataFrame entfernt.

Zusätzliche Ressourcen

So wählen Sie Zeilen nach Index in einem Pandas DataFrame aus
So erhalten Sie Zeilennummern in einem Pandas DataFrame
So finden Sie eindeutige Werte in einer Spalte in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert