So wählen sie einzelne zeilen in einem pandas dataframe aus

Von Dr. Benjamin Anderson Juli 25, 2023 Führung Keine Kommentare

Sie können die folgende Syntax verwenden, um einzelne Zeilen in einem Pandas-DataFrame auszuwählen:

 df = df. drop_duplicates ()

Und Sie können die folgende Syntax verwenden, um einzelne Zeilen in bestimmten Spalten in einem Pandas-DataFrame auszuwählen:

 df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])

Die folgenden Beispiele zeigen, wie diese Syntax in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' a ':[4,4,3,8],
                   ' b ': [2, 2, 6, 8],
                   ' c ': [2, 2, 9, 9]})

#view DataFrame
df

	a b c
0 4 2 2
1 4 2 2
2 3 6 9
3 8 8 9

Beispiel 1: Wählen Sie in allen Spalten eindeutige Zeilen aus

Der folgende Code zeigt, wie eindeutige Zeilen in allen Spalten des Pandas DataFrame ausgewählt werden:

 #drop duplicates from DataFrame
df = df. drop_duplicates ()

#view DataFrame
df

	a b c
0 4 2 2
2 3 6 9
3 8 8 9

Die erste und zweite Zeile waren Duplikate, daher haben die Pandas die zweite Zeile weggelassen.

Standardmäßig behält die Funktion drop_duplicates() das erste Duplikat bei. Sie können jedoch angeben, dass stattdessen das letzte Duplikat beibehalten werden soll:

 #drop duplicates from DataFrame, keep last duplicate
df = df. drop_duplicates (keep=' last ')

#view DataFrame
df

	a b c
1 4 2 2
2 3 6 9
3 8 8 9

Beispiel 2: Wählen Sie eindeutige Zeilen in bestimmten Spalten aus

Der folgende Code zeigt, wie einzelne Zeilen in der einzelnen „c“-Spalte des DataFrame ausgewählt werden:

 #drop duplicates from column 'c' in DataFrame
df = df. drop_duplicates (subset=[' c '])

#view DataFrame
df
	a b c
0 4 2 2
2 3 6 9

Zwei Zeilen wurden aus dem DataFrame entfernt.

Zusätzliche Ressourcen

So wählen Sie Zeilen nach Index in einem Pandas DataFrame aus
So erhalten Sie Zeilennummern in einem Pandas DataFrame
So finden Sie eindeutige Werte in einer Spalte in Pandas

Über den Autor

Dr. Benjamin Anderson

Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen

Beispiel 1: Wählen Sie in allen Spalten eindeutige Zeilen aus

Beispiel 2: Wählen Sie eindeutige Zeilen in bestimmten Spalten aus

Zusätzliche Ressourcen

Über den Autor

Dr. Benjamin Anderson

Einen Kommentar hinzufügen