Pandas:부분 일치를 기반으로 열을 선택하는 방법
다음 방법을 사용하여 부분 일치를 기반으로 Pandas DataFrame에서 열을 선택할 수 있습니다.
방법 1: 부분 일치를 기준으로 열 선택
#select columns that contain 'team'
df. loc [:, df. columns . str . contains (' team ')]
방법 2: 여러 부분 일치를 기반으로 열 선택
#select columns that contain 'team' or 'rebounds'
df. loc [:, df. columns . str . contains (' team|rebounds ')]
다음 예에서는 다음 Pandas DataFrame에서 각 메서드를 사용하는 방법을 보여줍니다.
import pandas as pd #createDataFrame df = pd. DataFrame ({' team_name ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' team_points ': [5, 7, 7, 9, 12, 9, 9, 4], ' assists ': [11, 8, 10, 6, 6, 5, 9, 12], ' rebounds ': [6, 7, 7, 6, 10, 12, 10, 9]}) #view DataFrame print (df) team_name team_points assists rebounds 0 A 5 11 6 1 To 7 8 7 2 To 7 10 7 3 to 9 6 6 4 B 12 6 10 5 B 9 5 12 6 B 9 9 10 7 B 4 12 9
예 1: 부분 일치를 기준으로 열 선택
다음 코드는 열 이름에 “team”이 포함된 Pandas DataFrame의 모든 열을 선택하는 방법을 보여줍니다.
#select columns that contain 'team'
df_team_cols = df. loc [:, df. columns . str . contains (' team ')]
#view results
print (df_team_cols)
team_name team_points
0 to 5
1 to 7
2 to 7
3 to 9
4 B 12
5 B 9
6 B 9
7 B 4
이름에 “team”이 포함된 두 열이 모두 반환됩니다.
예 2: 여러 부분 일치를 기반으로 열 선택
다음 코드는 열 이름에 “team” 또는 “bounces”가 포함된 pandas DataFrame의 모든 열을 선택하는 방법을 보여줍니다.
#select columns that contain 'team' or 'rebounds'
df_team_rebs = df. loc [:, df. columns . str . contains (' team|rebounds ')]
#view results
print (df_team_rebs)
team_name team_points rebounds
0 to 5 6
1 To 7 7
2 to 7 7
3 to 9 6
4 B 12 10
5 B 9 12
6 B 9 10
7 B 4 9
이름에 “팀” 또는 “리바운드”가 포함된 모든 열이 반환됩니다.
참고 : | 연산자는 팬더에서 “OR”을 나타냅니다.
원하는 만큼 부분 문자열 일치를 찾으려면 이러한 연산자를 원하는 만큼 자유롭게 사용하세요.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Pandas에서 이름으로 열을 선택하는 방법
Pandas에서 인덱스로 열을 선택하는 방법
Pandas에서 데이터 유형별로 열을 선택하는 방법