如何在 pandas dataframe 中选择单行
您可以使用以下语法来选择 pandas DataFrame 中的单行:
df = df. drop_duplicates ()
您可以使用以下语法来选择 pandas DataFrame 中特定列中的单行:
df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])
以下示例展示了如何在实践中通过以下 pandas DataFrame 使用此语法:
import pandas as pd #createDataFrame df = pd. DataFrame ({' a ':[4,4,3,8], ' b ': [2, 2, 6, 8], ' c ': [2, 2, 9, 9]}) #view DataFrame df a b c 0 4 2 2 1 4 2 2 2 3 6 9 3 8 8 9
示例 1:选择所有列中唯一的行
以下代码显示了如何在 pandas DataFrame 的所有列中选择唯一的行:
#drop duplicates from DataFrame df = df. drop_duplicates () #view DataFrame df a b c 0 4 2 2 2 3 6 9 3 8 8 9
第一行和第二行是重复的,所以熊猫放弃了第二行。
默认情况下, drop_duplicates()函数将保留第一个重复项。但是,您可以指定保留最后一个重复项:
#drop duplicates from DataFrame, keep last duplicate df = df. drop_duplicates (keep=' last ') #view DataFrame df a b c 1 4 2 2 2 3 6 9 3 8 8 9
示例 2:选择特定列中的唯一行
以下代码显示了如何在 DataFrame 的单个“c”列中选择单个行:
#drop duplicates from column 'c' in DataFrame df = df. drop_duplicates (subset=[' c ']) #view DataFrame df a b c 0 4 2 2 2 3 6 9
从 DataFrame 中删除了两行。
其他资源
如何在 Pandas DataFrame 中按索引选择行
如何获取 Pandas DataFrame 中的行号
如何在 Pandas 中查找列中的唯一值