在 python 中使用 pandas 最简单的方法:以 pd 格式导入 pandas
pandas是一个基于 Python 编程语言构建的开源数据分析库。
将 pandas 导入 Python 环境的最常见方法是使用以下语法:
import pandas as pd
代码中的import pandas部分告诉 Python 将 pandas 数据分析库集成到您当前的环境中。
然后,代码的as pd部分告诉 Python 为 pandas 指定别名pd 。这允许您通过简单地输入 pd.function_name 而不是 pandas.function_name 来使用 pandas 函数。
导入 pandas 后,您就可以使用内置函数来创建和分析数据。
如何创建系列和数据框
在 pandas 中最常见的数据类型是Series和DataFrames 。
1.系列
系列是一维数组。以下代码展示了如何使用 pandas 快速创建系列:
import pandas as pd
#defineSeries
x = pd. Series ([25, 12, 15, 14, 19, 23, 25, 29])
#displaySeries
print (x)
0 25
1 12
2 15
3 14
4 19
5 23
6 25
7 29
dtype: int64
2. 数据框
DataFrame 是一个二维数组。以下代码展示了如何使用pandas快速创建DataFrame:
import pandas as pd
#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#display DataFrame
print (df)
points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6
5 23 9 5
6 25 9 9
7 29 4 12
导入 Pandas 时的潜在错误
导入 pandas 时可能会遇到两个潜在错误:
1.名称错误:名称’pd’未定义
您可能遇到的错误是:
NameError : name 'pd' is not defined
当导入 pandas 时未能为其添加别名时,就会发生这种情况。阅读本教程以了解如何快速修复此错误。
2.没有名为pandas的模块
您可能遇到的另一个错误是:
no module name ' pandas '
当 Python 在当前环境中未检测到 pandas 库时,就会发生这种情况。阅读 本教程以了解如何修复此错误。
其他资源
如果您想了解有关 pandas 的更多信息,请查看以下资源:
Python 统计指南的完整列表
在线熊猫文档页面
用于数据分析的 Python 作者:Wes McKinney
熊猫官方推特页面