Pandas에서 중복 열을 제거하는 방법(예제 포함)


다음 기본 구문을 사용하여 Pandas에서 중복 열을 제거할 수 있습니다.

 df. T. drop_duplicates (). T

다음 예에서는 이 구문을 실제로 사용하는 방법을 보여줍니다.

예: Pandas에서 중복 열 제거

다음과 같은 팬더 DataFrame이 있다고 가정합니다.

 import pandas as pd

#create DataFrame with duplicate columns
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

df. columns = ['team', 'points', 'points', 'rebounds']

#view DataFrame
df

	team points points rebounds
0 A 25 25 11
1 A 12 12 8
2 A 15 15 10
3 A 14 14 6
4 B 19 19 6
5 B 23 23 5
6 B 25 25 9
7 B 29 29 12

다음 코드를 사용하여 중복된 “포인트” 열을 제거할 수 있습니다.

 #remove duplicate columns
df. T. drop_duplicates (). T

team points rebounds
0 to 25 11
1 to 12 8
2 to 15 10
3 to 14 6
4 B 19 6
5 B 23 5
6 B 25 9
7 B 29 12

“포인트” 열은 제거되었지만 다른 모든 열은 DataFrame에 남아 있습니다.

또한 이 코드는 열의 이름이 다르지만 동일한 값을 포함하는 경우에도 중복된 열을 제거한다는 점도 주목할 가치가 있습니다.

예를 들어 다음과 같은 pandas DataFrame이 있다고 가정해 보겠습니다.

 import pandas as pd

#create DataFrame with duplicate columns
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' points2 ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points points2 rebounds
0 A 25 25 11
1 A 12 12 8
2 A 15 15 10
3 A 14 14 6
4 B 19 19 6
5 B 23 23 5
6 B 25 25 9
7 B 29 29 12

“points” 및 “points2” 열에는 동일한 값이 포함되어 있습니다.

다음 코드를 사용하여 중복된 ‘points2’ 열을 제거할 수 있습니다.

 #remove duplicate columns
df. T. drop_duplicates (). T

team points rebounds
0 to 25 11
1 to 12 8
2 to 15 10
3 to 14 6
4 B 19 6
5 B 23 5
6 B 25 9
7 B 29 12

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 기능을 수행하는 방법을 설명합니다.

Pandas DataFrame에서 중복 행을 제거하는 방법
Pandas에서 열을 삭제하는 방법
Pandas에서 열을 제외하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다