Pandas 与 loc:有什么区别?


当选择 pandas DataFrame 的行和列时, .loc.at是两个常用的函数。

这是两个函数之间的细微差别:

  • .loc可以采用多行和多列作为输入参数
  • .at只能采用单行和单列作为输入参数

以下示例展示了如何在实践中通过以下 pandas DataFrame 使用每个函数:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

示例 1:如何在 Pandas 中使用 loc

以下代码显示如何使用.loc访问位于点列索引位置 0 处的 DataFrame 中的值:

 #select value located at index position 0 of the points column
df. loc [0, ' points ']

18

这将返回值18

以下代码展示了如何使用.loc访问索引值 0 和 4 之间的行以及点和辅助列:

 #select rows between index values 0 and 4 and columns 'points' and 'assists'
df. loc [0:4, [' points ', ' assists ']]

        assist points
0 18 5
1 22 7
2 19 7
3 14 9
4 14 12

无论我们想要访问单个值还是一组行和列, .loc函数都可以做到这两点。

示例 2:如何在 Pandas 中使用 at

以下代码显示如何使用.at访问 DataFrame 中位于点列索引位置 0 处的值:

 #select value located at index position 0 of the points column
df. at [0, ' points ']

18

这将返回值18

然而,假设我们尝试使用at来访问索引值 0 和 4 之间的行以及点和辅助列:

 #try to select rows between index values 0 and 4 and columns 'points' and 'assists'
df. at [0:4, [' points ', ' assists ']]

TypeError : unhashable type: 'list'

我们收到错误,因为at函数无法将多行或多列作为输入参数。

结论

当您想要访问 pandas DataFrame 中的单个值时, locat函数可以正常工作。

但是,当您想要访问一组行和列时,只有loc函数可以做到这一点。

相关: Pandas loc 与 iloc:有什么区别?

其他资源

以下教程解释了如何在 pandas 中执行其他常见操作:

如何使用 Pandas Loc 根据多个条件选择行
如何在 Pandas 中根据列值选择行
如何在 Pandas 中按索引选择行

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注