Pandas: so wählen sie spalten basierend auf teilweiser übereinstimmung aus


Sie können die folgenden Methoden verwenden, um Spalten in einem Pandas-DataFrame basierend auf einer teilweisen Übereinstimmung auszuwählen:

Methode 1: Wählen Sie Spalten basierend auf einer teilweisen Übereinstimmung aus

 #select columns that contain 'team'
df. loc [:, df. columns . str . contains (' team ')]

Methode 2: Wählen Sie Spalten basierend auf mehreren Teilübereinstimmungen aus

 #select columns that contain 'team' or 'rebounds'
df. loc [:, df. columns . str . contains (' team|rebounds ')]

Die folgenden Beispiele zeigen, wie jede Methode mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team_name ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' team_points ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' assists ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' rebounds ': [6, 7, 7, 6, 10, 12, 10, 9]})

#view DataFrame
print (df)

  team_name team_points assists rebounds
0 A 5 11 6
1 To 7 8 7
2 To 7 10 7
3 to 9 6 6
4 B 12 6 10
5 B 9 5 12
6 B 9 9 10
7 B 4 12 9

Beispiel 1: Wählen Sie Spalten basierend auf einer teilweisen Übereinstimmung aus

Der folgende Code zeigt, wie alle Spalten im Pandas-DataFrame ausgewählt werden, die „team“ im Spaltennamen enthalten:

 #select columns that contain 'team'
df_team_cols = df. loc [:, df. columns . str . contains (' team ')]

#view results
print (df_team_cols)

  team_name team_points
0 to 5
1 to 7
2 to 7
3 to 9
4 B 12
5 B 9
6 B 9
7 B 4

Beachten Sie, dass beide Spalten mit „team“ im Namen zurückgegeben werden.

Beispiel 2: Wählen Sie Spalten basierend auf mehreren Teilübereinstimmungen aus

Der folgende Code zeigt, wie alle Spalten im Pandas DataFrame ausgewählt werden, die „team“ oder „bounces“ im Spaltennamen enthalten:

 #select columns that contain 'team' or 'rebounds'
df_team_rebs = df. loc [:, df. columns . str . contains (' team|rebounds ')]

#view results
print (df_team_rebs)

  team_name team_points rebounds
0 to 5 6
1 To 7 7
2 to 7 7
3 to 9 6
4 B 12 10
5 B 9 12
6 B 9 10
7 B 4 9

Alle Spalten mit „team“ oder „rebounds“ im Namen werden zurückgegeben.

Hinweis : Die | Der Operator stellt in Pandas „OR“ dar.

Sie können so viele dieser Operatoren verwenden, wie Sie möchten, um so viele Teilzeichenfolgenübereinstimmungen zu finden, wie Sie möchten.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

So wählen Sie Spalten nach Namen in Pandas aus
So wählen Sie Spalten nach Index in Pandas aus
So wählen Sie Spalten nach Datentyp in Pandas aus

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert