Pandas 与 loc:有什么区别?
当选择 pandas DataFrame 的行和列时, .loc和.at是两个常用的函数。
这是两个函数之间的细微差别:
- .loc可以采用多行和多列作为输入参数
- .at只能采用单行和单列作为输入参数
以下示例展示了如何在实践中通过以下 pandas DataFrame 使用每个函数:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 A 18 5 11 1 B 22 7 8 2 C 19 7 10 3 D 14 9 6 4 E 14 12 6 5 F 11 9 5 6 G 20 9 9 7:28 4 12
示例 1:如何在 Pandas 中使用 loc
以下代码显示如何使用.loc访问位于点列索引位置 0 处的 DataFrame 中的值:
#select value located at index position 0 of the points column
df. loc [0, ' points ']
18
这将返回值18 。
以下代码展示了如何使用.loc访问索引值 0 和 4 之间的行以及点和辅助列:
#select rows between index values 0 and 4 and columns 'points' and 'assists'
df. loc [0:4, [' points ', ' assists ']]
assist points
0 18 5
1 22 7
2 19 7
3 14 9
4 14 12
无论我们想要访问单个值还是一组行和列, .loc函数都可以做到这两点。
示例 2:如何在 Pandas 中使用 at
以下代码显示如何使用.at访问 DataFrame 中位于点列索引位置 0 处的值:
#select value located at index position 0 of the points column
df. at [0, ' points ']
18
这将返回值18 。
然而,假设我们尝试使用at来访问索引值 0 和 4 之间的行以及点和辅助列:
#try to select rows between index values 0 and 4 and columns 'points' and 'assists'
df. at [0:4, [' points ', ' assists ']]
TypeError : unhashable type: 'list'
我们收到错误,因为at函数无法将多行或多列作为输入参数。
结论
当您想要访问 pandas DataFrame 中的单个值时, loc和at函数可以正常工作。
但是,当您想要访问一组行和列时,只有loc函数可以做到这一点。
其他资源
以下教程解释了如何在 pandas 中执行其他常见操作:
如何使用 Pandas Loc 根据多个条件选择行
如何在 Pandas 中根据列值选择行
如何在 Pandas 中按索引选择行