So entfernen sie doppelte spalten in pandas (mit beispielen)


Sie können die folgende grundlegende Syntax verwenden, um doppelte Spalten in Pandas zu entfernen:

 df. T. drop_duplicates (). T

Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.

Beispiel: Doppelte Spalten in Pandas entfernen

Angenommen, wir haben den folgenden Pandas-DataFrame:

 import pandas as pd

#create DataFrame with duplicate columns
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

df. columns = ['team', 'points', 'points', 'rebounds']

#view DataFrame
df

	team points points rebounds
0 A 25 25 11
1 A 12 12 8
2 A 15 15 10
3 A 14 14 6
4 B 19 19 6
5 B 23 23 5
6 B 25 25 9
7 B 29 29 12

Wir können den folgenden Code verwenden, um die doppelte Spalte „Punkte“ zu entfernen:

 #remove duplicate columns
df. T. drop_duplicates (). T

team points rebounds
0 to 25 11
1 to 12 8
2 to 15 10
3 to 14 6
4 B 19 6
5 B 23 5
6 B 25 9
7 B 29 12

Beachten Sie, dass die Spalte „Punkte“ entfernt wurde, während alle anderen Spalten im DataFrame verblieben sind.

Es ist auch erwähnenswert, dass dieser Code doppelte Spalten entfernt, selbst wenn die Spalten unterschiedliche Namen haben, aber identische Werte enthalten.

Angenommen, wir haben den folgenden Pandas-DataFrame:

 import pandas as pd

#create DataFrame with duplicate columns
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' points2 ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points points2 rebounds
0 A 25 25 11
1 A 12 12 8
2 A 15 15 10
3 A 14 14 6
4 B 19 19 6
5 B 23 23 5
6 B 25 25 9
7 B 29 29 12

Beachten Sie, dass die Spalten „points“ und „points2“ identische Werte enthalten.

Mit dem folgenden Code können wir die doppelte Spalte „points2“ entfernen:

 #remove duplicate columns
df. T. drop_duplicates (). T

team points rebounds
0 to 25 11
1 to 12 8
2 to 15 10
3 to 14 6
4 B 19 6
5 B 23 5
6 B 25 9
7 B 29 12

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere allgemeine Funktionen in Pandas ausgeführt werden:

So entfernen Sie doppelte Zeilen in einem Pandas DataFrame
So löschen Sie Spalten in Pandas
So schließen Sie Spalten in Pandas aus

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert