如何在 pandas dataframe 中选择单行


您可以使用以下语法来选择 pandas DataFrame 中的单行:

 df = df. drop_duplicates ()

您可以使用以下语法来选择 pandas DataFrame 中特定列中的单行:

 df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])

以下示例展示了如何在实践中通过以下 pandas DataFrame 使用此语法:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' a ':[4,4,3,8],
                   ' b ': [2, 2, 6, 8],
                   ' c ': [2, 2, 9, 9]})

#view DataFrame
df

	a b c
0 4 2 2
1 4 2 2
2 3 6 9
3 8 8 9

示例 1:选择所有列中唯一的行

以下代码显示了如何在 pandas DataFrame 的所有列中选择唯一的行:

 #drop duplicates from DataFrame
df = df. drop_duplicates ()

#view DataFrame
df

	a b c
0 4 2 2
2 3 6 9
3 8 8 9

第一行和第二行是重复的,所以熊猫放弃了第二行。

默认情况下, drop_duplicates()函数将保留第一个重复项。但是,您可以指定保留最后一个重复项:

 #drop duplicates from DataFrame, keep last duplicate
df = df. drop_duplicates (keep=' last ')

#view DataFrame
df

	a b c
1 4 2 2
2 3 6 9
3 8 8 9

示例 2:选择特定列中的唯一行

以下代码显示了如何在 DataFrame 的单个“c”列中选择单个行:

 #drop duplicates from column 'c' in DataFrame
df = df. drop_duplicates (subset=[' c '])

#view DataFrame
df
	a b c
0 4 2 2
2 3 6 9

从 DataFrame 中删除了两行。

其他资源

如何在 Pandas DataFrame 中按索引选择行
如何获取 Pandas DataFrame 中的行号
如何在 Pandas 中查找列中的唯一值

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注