So entfernen sie doppelte spalten in pandas (mit beispielen)
Sie können die folgende grundlegende Syntax verwenden, um doppelte Spalten in Pandas zu entfernen:
df. T. drop_duplicates (). T
Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.
Beispiel: Doppelte Spalten in Pandas entfernen
Angenommen, wir haben den folgenden Pandas-DataFrame:
import pandas as pd #create DataFrame with duplicate columns df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [25, 12, 15, 14, 19, 23, 25, 29], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) df. columns = ['team', 'points', 'points', 'rebounds'] #view DataFrame df team points points rebounds 0 A 25 25 11 1 A 12 12 8 2 A 15 15 10 3 A 14 14 6 4 B 19 19 6 5 B 23 23 5 6 B 25 25 9 7 B 29 29 12
Wir können den folgenden Code verwenden, um die doppelte Spalte „Punkte“ zu entfernen:
#remove duplicate columns df. T. drop_duplicates (). T team points rebounds 0 to 25 11 1 to 12 8 2 to 15 10 3 to 14 6 4 B 19 6 5 B 23 5 6 B 25 9 7 B 29 12
Beachten Sie, dass die Spalte „Punkte“ entfernt wurde, während alle anderen Spalten im DataFrame verblieben sind.
Es ist auch erwähnenswert, dass dieser Code doppelte Spalten entfernt, selbst wenn die Spalten unterschiedliche Namen haben, aber identische Werte enthalten.
Angenommen, wir haben den folgenden Pandas-DataFrame:
import pandas as pd #create DataFrame with duplicate columns df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' points2 ': [25, 12, 15, 14, 19, 23, 25, 29], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame df team points points2 rebounds 0 A 25 25 11 1 A 12 12 8 2 A 15 15 10 3 A 14 14 6 4 B 19 19 6 5 B 23 23 5 6 B 25 25 9 7 B 29 29 12
Beachten Sie, dass die Spalten „points“ und „points2“ identische Werte enthalten.
Mit dem folgenden Code können wir die doppelte Spalte „points2“ entfernen:
#remove duplicate columns df. T. drop_duplicates (). T team points rebounds 0 to 25 11 1 to 12 8 2 to 15 10 3 to 14 6 4 B 19 6 5 B 23 5 6 B 25 9 7 B 29 12
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere allgemeine Funktionen in Pandas ausgeführt werden:
So entfernen Sie doppelte Zeilen in einem Pandas DataFrame
So löschen Sie Spalten in Pandas
So schließen Sie Spalten in Pandas aus