Pandas dataframe에서 단일 행을 선택하는 방법
다음 구문을 사용하여 Pandas DataFrame에서 단일 행을 선택할 수 있습니다.
df = df. drop_duplicates ()
그리고 다음 구문을 사용하여 Pandas DataFrame의 특정 열에서 단일 행을 선택할 수 있습니다.
df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])
다음 예는 다음 pandas DataFrame에서 실제로 이 구문을 사용하는 방법을 보여줍니다.
import pandas as pd #createDataFrame df = pd. DataFrame ({' a ':[4,4,3,8], ' b ': [2, 2, 6, 8], ' c ': [2, 2, 9, 9]}) #view DataFrame df a b c 0 4 2 2 1 4 2 2 2 3 6 9 3 8 8 9
예 1: 모든 열에서 고유한 행 선택
다음 코드는 Pandas DataFrame의 모든 열에서 고유한 행을 선택하는 방법을 보여줍니다.
#drop duplicates from DataFrame df = df. drop_duplicates () #view DataFrame df a b c 0 4 2 2 2 3 6 9 3 8 8 9
첫 번째와 두 번째 줄은 중복되었으므로 팬더는 두 번째 줄을 삭제했습니다.
기본적으로 drop_duplicates() 함수는 첫 번째 복제본을 유지합니다. 그러나 대신 마지막 복제본을 유지하도록 지정할 수 있습니다.
#drop duplicates from DataFrame, keep last duplicate df = df. drop_duplicates (keep=' last ') #view DataFrame df a b c 1 4 2 2 2 3 6 9 3 8 8 9
예 2: 특정 열에서 고유한 행 선택
다음 코드는 DataFrame의 단일 “c” 열에서 단일 행을 선택하는 방법을 보여줍니다.
#drop duplicates from column 'c' in DataFrame df = df. drop_duplicates (subset=[' c ']) #view DataFrame df a b c 0 4 2 2 2 3 6 9
DataFrame에서 두 행이 제거되었습니다.
추가 리소스
Pandas DataFrame에서 인덱스로 행을 선택하는 방법
Pandas DataFrame에서 행 번호를 얻는 방법
Pandas의 열에서 고유한 값을 찾는 방법