Pandas dataframe에서 단일 행을 선택하는 방법


다음 구문을 사용하여 Pandas DataFrame에서 단일 행을 선택할 수 있습니다.

 df = df. drop_duplicates ()

그리고 다음 구문을 사용하여 Pandas DataFrame의 특정 열에서 단일 행을 선택할 수 있습니다.

 df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])

다음 예는 다음 pandas DataFrame에서 실제로 이 구문을 사용하는 방법을 보여줍니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' a ':[4,4,3,8],
                   ' b ': [2, 2, 6, 8],
                   ' c ': [2, 2, 9, 9]})

#view DataFrame
df

	a b c
0 4 2 2
1 4 2 2
2 3 6 9
3 8 8 9

예 1: 모든 열에서 고유한 행 선택

다음 코드는 Pandas DataFrame의 모든 열에서 고유한 행을 선택하는 방법을 보여줍니다.

 #drop duplicates from DataFrame
df = df. drop_duplicates ()

#view DataFrame
df

	a b c
0 4 2 2
2 3 6 9
3 8 8 9

첫 번째와 두 번째 줄은 중복되었으므로 팬더는 두 번째 줄을 삭제했습니다.

기본적으로 drop_duplicates() 함수는 첫 번째 복제본을 유지합니다. 그러나 대신 마지막 복제본을 유지하도록 지정할 수 있습니다.

 #drop duplicates from DataFrame, keep last duplicate
df = df. drop_duplicates (keep=' last ')

#view DataFrame
df

	a b c
1 4 2 2
2 3 6 9
3 8 8 9

예 2: 특정 열에서 고유한 행 선택

다음 코드는 DataFrame의 단일 “c” 열에서 단일 행을 선택하는 방법을 보여줍니다.

 #drop duplicates from column 'c' in DataFrame
df = df. drop_duplicates (subset=[' c '])

#view DataFrame
df
	a b c
0 4 2 2
2 3 6 9

DataFrame에서 두 행이 제거되었습니다.

추가 리소스

Pandas DataFrame에서 인덱스로 행을 선택하는 방법
Pandas DataFrame에서 행 번호를 얻는 방법
Pandas의 열에서 고유한 값을 찾는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다