Panda's: kolommen selecteren op basis van gedeeltelijke overeenkomst
U kunt de volgende methoden gebruiken om kolommen in een Panda DataFrame te selecteren op basis van een gedeeltelijke overeenkomst:
Methode 1: Selecteer kolommen op basis van gedeeltelijke overeenkomst
#select columns that contain 'team'
df. loc [:, df. columns . str . contains (' team ')]
Methode 2: Selecteer kolommen op basis van meerdere gedeeltelijke overeenkomsten
#select columns that contain 'team' or 'rebounds'
df. loc [:, df. columns . str . contains (' team|rebounds ')]
De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met de volgende panda’s DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team_name ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' team_points ': [5, 7, 7, 9, 12, 9, 9, 4], ' assists ': [11, 8, 10, 6, 6, 5, 9, 12], ' rebounds ': [6, 7, 7, 6, 10, 12, 10, 9]}) #view DataFrame print (df) team_name team_points assists rebounds 0 A 5 11 6 1 To 7 8 7 2 To 7 10 7 3 to 9 6 6 4 B 12 6 10 5 B 9 5 12 6 B 9 9 10 7 B 4 12 9
Voorbeeld 1: Selecteer kolommen op basis van gedeeltelijke overeenkomst
De volgende code laat zien hoe u alle kolommen in het Panda DataFrame selecteert die ‚team‘ in de kolomnaam bevatten:
#select columns that contain 'team'
df_team_cols = df. loc [:, df. columns . str . contains (' team ')]
#view results
print (df_team_cols)
team_name team_points
0 to 5
1 to 7
2 to 7
3 to 9
4 B 12
5 B 9
6 B 9
7 B 4
Houd er rekening mee dat beide kolommen met ‚team‘ in de naam worden geretourneerd.
Voorbeeld 2: Selecteer kolommen op basis van meerdere gedeeltelijke overeenkomsten
De volgende code laat zien hoe u alle kolommen in het Panda DataFrame selecteert die ‚team‘ of ‚bounces‘ in de kolomnaam bevatten:
#select columns that contain 'team' or 'rebounds'
df_team_rebs = df. loc [:, df. columns . str . contains (' team|rebounds ')]
#view results
print (df_team_rebs)
team_name team_points rebounds
0 to 5 6
1 To 7 7
2 to 7 7
3 to 9 6
4 B 12 10
5 B 9 12
6 B 9 10
7 B 4 9
Alle kolommen met ‚team‘ of ‚rebounds‘ in de naam worden geretourneerd.
Opmerking : de | de operator vertegenwoordigt „OR“ in panda’s.
Voel je vrij om zoveel van deze operatoren te gebruiken als je wilt, om zoveel gedeeltelijke stringmatches te vinden als je wilt.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:
Hoe u kolommen op naam selecteert in Pandas
Hoe u kolommen op index selecteert in Pandas
Hoe u kolommen selecteert op gegevenstype in Pandas