Pandas: как выбирать столбцы на основе частичного совпадения


Вы можете использовать следующие методы для выбора столбцов в DataFrame pandas на основе частичного совпадения:

Способ 1: выберите столбцы на основе частичного совпадения

 #select columns that contain 'team'
df. loc [:, df. columns . str . contains (' team ')]

Способ 2. Выберите столбцы на основе нескольких частичных совпадений.

 #select columns that contain 'team' or 'rebounds'
df. loc [:, df. columns . str . contains (' team|rebounds ')]

В следующих примерах показано, как использовать каждый метод со следующим DataFrame pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team_name ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' team_points ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' assists ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' rebounds ': [6, 7, 7, 6, 10, 12, 10, 9]})

#view DataFrame
print (df)

  team_name team_points assists rebounds
0 A 5 11 6
1 To 7 8 7
2 To 7 10 7
3 to 9 6 6
4 B 12 6 10
5 B 9 5 12
6 B 9 9 10
7 B 4 12 9

Пример 1. Выбор столбцов на основе частичного совпадения

Следующий код показывает, как выбрать все столбцы в DataFrame pandas, которые содержат слово «команда» в имени столбца:

 #select columns that contain 'team'
df_team_cols = df. loc [:, df. columns . str . contains (' team ')]

#view results
print (df_team_cols)

  team_name team_points
0 to 5
1 to 7
2 to 7
3 to 9
4 B 12
5 B 9
6 B 9
7 B 4

Обратите внимание, что возвращаются оба столбца со словом «команда» в названии.

Пример 2. Выбор столбцов на основе нескольких частичных совпадений

Следующий код показывает, как выбрать все столбцы в DataFrame pandas, которые содержат слова «команда» или «отказы» в имени столбца:

 #select columns that contain 'team' or 'rebounds'
df_team_rebs = df. loc [:, df. columns . str . contains (' team|rebounds ')]

#view results
print (df_team_rebs)

  team_name team_points rebounds
0 to 5 6
1 To 7 7
2 to 7 7
3 to 9 6
4 B 12 10
5 B 9 12
6 B 9 10
7 B 4 9

Возвращаются все столбцы, в названии которых есть слова «команда» или «подборы».

Примечание : | оператор представляет «ИЛИ» в пандах.

Не стесняйтесь использовать столько операторов, сколько хотите, чтобы найти столько частичных совпадений строк, сколько захотите.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:

Как выбрать столбцы по имени в Pandas
Как выбрать столбцы по индексу в Pandas
Как выбрать столбцы по типу данных в Pandas

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *