Hoe dubbele kolommen in panda's te verwijderen (met voorbeelden)


U kunt de volgende basissyntaxis gebruiken om dubbele kolommen in panda’s te verwijderen:

 df. T. drop_duplicates (). T

De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: verwijder dubbele kolommen in panda’s

Stel dat we de volgende panda’s DataFrame hebben:

 import pandas as pd

#create DataFrame with duplicate columns
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

df. columns = ['team', 'points', 'points', 'rebounds']

#view DataFrame
df

	team points points rebounds
0 A 25 25 11
1 A 12 12 8
2 A 15 15 10
3 A 14 14 6
4 B 19 19 6
5 B 23 23 5
6 B 25 25 9
7 B 29 29 12

We kunnen de volgende code gebruiken om de dubbele kolom ‘punten’ te verwijderen:

 #remove duplicate columns
df. T. drop_duplicates (). T

team points rebounds
0 to 25 11
1 to 12 8
2 to 15 10
3 to 14 6
4 B 19 6
5 B 23 5
6 B 25 9
7 B 29 12

Merk op dat de kolom “punten” is verwijderd terwijl alle andere kolommen in het DataFrame bleven.

Het is ook vermeldenswaard dat deze code dubbele kolommen verwijdert, zelfs als de kolommen verschillende namen hebben, maar identieke waarden bevatten.

Stel dat we bijvoorbeeld de volgende panda’s DataFrame hebben:

 import pandas as pd

#create DataFrame with duplicate columns
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' points2 ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points points2 rebounds
0 A 25 25 11
1 A 12 12 8
2 A 15 15 10
3 A 14 14 6
4 B 19 19 6
5 B 23 23 5
6 B 25 25 9
7 B 29 29 12

Merk op dat de kolommen “punten” en “punten2” identieke waarden bevatten.

We kunnen de volgende code gebruiken om de dubbele kolom ‚points2‘ te verwijderen:

 #remove duplicate columns
df. T. drop_duplicates (). T

team points rebounds
0 to 25 11
1 to 12 8
2 to 15 10
3 to 14 6
4 B 19 6
5 B 23 5
6 B 25 9
7 B 29 12

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende functies in panda’s kunt uitvoeren:

Hoe dubbele rijen in een Pandas DataFrame te verwijderen
Hoe kolommen in Panda’s te verwijderen
Hoe u kolommen uitsluit in Panda’s

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert