Panda's: kolommen selecteren op basis van gedeeltelijke overeenkomst


U kunt de volgende methoden gebruiken om kolommen in een Panda DataFrame te selecteren op basis van een gedeeltelijke overeenkomst:

Methode 1: Selecteer kolommen op basis van gedeeltelijke overeenkomst

 #select columns that contain 'team'
df. loc [:, df. columns . str . contains (' team ')]

Methode 2: Selecteer kolommen op basis van meerdere gedeeltelijke overeenkomsten

 #select columns that contain 'team' or 'rebounds'
df. loc [:, df. columns . str . contains (' team|rebounds ')]

De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met de volgende panda’s DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team_name ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' team_points ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' assists ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' rebounds ': [6, 7, 7, 6, 10, 12, 10, 9]})

#view DataFrame
print (df)

  team_name team_points assists rebounds
0 A 5 11 6
1 To 7 8 7
2 To 7 10 7
3 to 9 6 6
4 B 12 6 10
5 B 9 5 12
6 B 9 9 10
7 B 4 12 9

Voorbeeld 1: Selecteer kolommen op basis van gedeeltelijke overeenkomst

De volgende code laat zien hoe u alle kolommen in het Panda DataFrame selecteert die ‚team‘ in de kolomnaam bevatten:

 #select columns that contain 'team'
df_team_cols = df. loc [:, df. columns . str . contains (' team ')]

#view results
print (df_team_cols)

  team_name team_points
0 to 5
1 to 7
2 to 7
3 to 9
4 B 12
5 B 9
6 B 9
7 B 4

Houd er rekening mee dat beide kolommen met ‚team‘ in de naam worden geretourneerd.

Voorbeeld 2: Selecteer kolommen op basis van meerdere gedeeltelijke overeenkomsten

De volgende code laat zien hoe u alle kolommen in het Panda DataFrame selecteert die ‚team‘ of ‚bounces‘ in de kolomnaam bevatten:

 #select columns that contain 'team' or 'rebounds'
df_team_rebs = df. loc [:, df. columns . str . contains (' team|rebounds ')]

#view results
print (df_team_rebs)

  team_name team_points rebounds
0 to 5 6
1 To 7 7
2 to 7 7
3 to 9 6
4 B 12 10
5 B 9 12
6 B 9 10
7 B 4 9

Alle kolommen met ‚team‘ of ‚rebounds‘ in de naam worden geretourneerd.

Opmerking : de | de operator vertegenwoordigt „OR“ in panda’s.

Voel je vrij om zoveel van deze operatoren te gebruiken als je wilt, om zoveel gedeeltelijke stringmatches te vinden als je wilt.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe u kolommen op naam selecteert in Pandas
Hoe u kolommen op index selecteert in Pandas
Hoe u kolommen selecteert op gegevenstype in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert