Pandas: so wählen sie spalten basierend auf teilweiser übereinstimmung aus
Sie können die folgenden Methoden verwenden, um Spalten in einem Pandas-DataFrame basierend auf einer teilweisen Übereinstimmung auszuwählen:
Methode 1: Wählen Sie Spalten basierend auf einer teilweisen Übereinstimmung aus
#select columns that contain 'team'
df. loc [:, df. columns . str . contains (' team ')]
Methode 2: Wählen Sie Spalten basierend auf mehreren Teilübereinstimmungen aus
#select columns that contain 'team' or 'rebounds'
df. loc [:, df. columns . str . contains (' team|rebounds ')]
Die folgenden Beispiele zeigen, wie jede Methode mit dem folgenden Pandas DataFrame verwendet wird:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team_name ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' team_points ': [5, 7, 7, 9, 12, 9, 9, 4], ' assists ': [11, 8, 10, 6, 6, 5, 9, 12], ' rebounds ': [6, 7, 7, 6, 10, 12, 10, 9]}) #view DataFrame print (df) team_name team_points assists rebounds 0 A 5 11 6 1 To 7 8 7 2 To 7 10 7 3 to 9 6 6 4 B 12 6 10 5 B 9 5 12 6 B 9 9 10 7 B 4 12 9
Beispiel 1: Wählen Sie Spalten basierend auf einer teilweisen Übereinstimmung aus
Der folgende Code zeigt, wie alle Spalten im Pandas-DataFrame ausgewählt werden, die „team“ im Spaltennamen enthalten:
#select columns that contain 'team'
df_team_cols = df. loc [:, df. columns . str . contains (' team ')]
#view results
print (df_team_cols)
team_name team_points
0 to 5
1 to 7
2 to 7
3 to 9
4 B 12
5 B 9
6 B 9
7 B 4
Beachten Sie, dass beide Spalten mit „team“ im Namen zurückgegeben werden.
Beispiel 2: Wählen Sie Spalten basierend auf mehreren Teilübereinstimmungen aus
Der folgende Code zeigt, wie alle Spalten im Pandas DataFrame ausgewählt werden, die „team“ oder „bounces“ im Spaltennamen enthalten:
#select columns that contain 'team' or 'rebounds'
df_team_rebs = df. loc [:, df. columns . str . contains (' team|rebounds ')]
#view results
print (df_team_rebs)
team_name team_points rebounds
0 to 5 6
1 To 7 7
2 to 7 7
3 to 9 6
4 B 12 10
5 B 9 12
6 B 9 10
7 B 4 9
Alle Spalten mit „team“ oder „rebounds“ im Namen werden zurückgegeben.
Hinweis : Die | Der Operator stellt in Pandas „OR“ dar.
Sie können so viele dieser Operatoren verwenden, wie Sie möchten, um so viele Teilzeichenfolgenübereinstimmungen zu finden, wie Sie möchten.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
So wählen Sie Spalten nach Namen in Pandas aus
So wählen Sie Spalten nach Index in Pandas aus
So wählen Sie Spalten nach Datentyp in Pandas aus