Hoe dubbele kolommen in panda's te verwijderen (met voorbeelden)
U kunt de volgende basissyntaxis gebruiken om dubbele kolommen in panda’s te verwijderen:
df. T. drop_duplicates (). T
De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: verwijder dubbele kolommen in panda’s
Stel dat we de volgende panda’s DataFrame hebben:
import pandas as pd #create DataFrame with duplicate columns df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [25, 12, 15, 14, 19, 23, 25, 29], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) df. columns = ['team', 'points', 'points', 'rebounds'] #view DataFrame df team points points rebounds 0 A 25 25 11 1 A 12 12 8 2 A 15 15 10 3 A 14 14 6 4 B 19 19 6 5 B 23 23 5 6 B 25 25 9 7 B 29 29 12
We kunnen de volgende code gebruiken om de dubbele kolom ‘punten’ te verwijderen:
#remove duplicate columns df. T. drop_duplicates (). T team points rebounds 0 to 25 11 1 to 12 8 2 to 15 10 3 to 14 6 4 B 19 6 5 B 23 5 6 B 25 9 7 B 29 12
Merk op dat de kolom “punten” is verwijderd terwijl alle andere kolommen in het DataFrame bleven.
Het is ook vermeldenswaard dat deze code dubbele kolommen verwijdert, zelfs als de kolommen verschillende namen hebben, maar identieke waarden bevatten.
Stel dat we bijvoorbeeld de volgende panda’s DataFrame hebben:
import pandas as pd #create DataFrame with duplicate columns df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' points2 ': [25, 12, 15, 14, 19, 23, 25, 29], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame df team points points2 rebounds 0 A 25 25 11 1 A 12 12 8 2 A 15 15 10 3 A 14 14 6 4 B 19 19 6 5 B 23 23 5 6 B 25 25 9 7 B 29 29 12
Merk op dat de kolommen “punten” en “punten2” identieke waarden bevatten.
We kunnen de volgende code gebruiken om de dubbele kolom ‚points2‘ te verwijderen:
#remove duplicate columns df. T. drop_duplicates (). T team points rebounds 0 to 25 11 1 to 12 8 2 to 15 10 3 to 14 6 4 B 19 6 5 B 23 5 6 B 25 9 7 B 29 12
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende functies in panda’s kunt uitvoeren:
Hoe dubbele rijen in een Pandas DataFrame te verwijderen
Hoe kolommen in Panda’s te verwijderen
Hoe u kolommen uitsluit in Panda’s