Pandas에서 중복 열을 제거하는 방법(예제 포함)
다음 기본 구문을 사용하여 Pandas에서 중복 열을 제거할 수 있습니다.
df. T. drop_duplicates (). T
다음 예에서는 이 구문을 실제로 사용하는 방법을 보여줍니다.
예: Pandas에서 중복 열 제거
다음과 같은 팬더 DataFrame이 있다고 가정합니다.
import pandas as pd #create DataFrame with duplicate columns df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [25, 12, 15, 14, 19, 23, 25, 29], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) df. columns = ['team', 'points', 'points', 'rebounds'] #view DataFrame df team points points rebounds 0 A 25 25 11 1 A 12 12 8 2 A 15 15 10 3 A 14 14 6 4 B 19 19 6 5 B 23 23 5 6 B 25 25 9 7 B 29 29 12
다음 코드를 사용하여 중복된 “포인트” 열을 제거할 수 있습니다.
#remove duplicate columns df. T. drop_duplicates (). T team points rebounds 0 to 25 11 1 to 12 8 2 to 15 10 3 to 14 6 4 B 19 6 5 B 23 5 6 B 25 9 7 B 29 12
“포인트” 열은 제거되었지만 다른 모든 열은 DataFrame에 남아 있습니다.
또한 이 코드는 열의 이름이 다르지만 동일한 값을 포함하는 경우에도 중복된 열을 제거한다는 점도 주목할 가치가 있습니다.
예를 들어 다음과 같은 pandas DataFrame이 있다고 가정해 보겠습니다.
import pandas as pd #create DataFrame with duplicate columns df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' points2 ': [25, 12, 15, 14, 19, 23, 25, 29], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame df team points points2 rebounds 0 A 25 25 11 1 A 12 12 8 2 A 15 15 10 3 A 14 14 6 4 B 19 19 6 5 B 23 23 5 6 B 25 25 9 7 B 29 29 12
“points” 및 “points2” 열에는 동일한 값이 포함되어 있습니다.
다음 코드를 사용하여 중복된 ‘points2’ 열을 제거할 수 있습니다.
#remove duplicate columns df. T. drop_duplicates (). T team points rebounds 0 to 25 11 1 to 12 8 2 to 15 10 3 to 14 6 4 B 19 6 5 B 23 5 6 B 25 9 7 B 29 12
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 기능을 수행하는 방법을 설명합니다.
Pandas DataFrame에서 중복 행을 제거하는 방법
Pandas에서 열을 삭제하는 방법
Pandas에서 열을 제외하는 방법