Pandas:导入excel文件时设置列名


将 Excel 文件导入 pandas 时,可以使用以下基本语法来定义 DataFrame 的列名称:

 colnames = [' col1 ', ' col2 ', ' col3 ']

df = pd. read_excel (' my_data.xlsx ', names=colnames)

名称参数采用要用于 DataFrame 中的列的名称列表。

通过使用此参数,您还告诉 pandas 使用 Excel 文件的第一行作为 DataFrame 的第一行,而不是将其用作标题行。

以下示例展示了如何在实践中使用此语法。

示例:将 Excel 文件导入 Pandas 时设置列名

假设我们有以下名为Players_data.xlsx的 Excel 文件:

从文件中我们可以看到第一行不包含任何列名。

如果我们使用read_excel()函数导入 Excel 文件,pandas 将尝试使用第一行中的值作为 DataFrame 的列名称:

 import pandas as pd

#import Excel file
df = pd. read_excel (' players_data.xlsx ')

#view resulting DataFrame
print (df)

   At 22 10
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

但是,我们可以在导入 Excel 文件时使用名称参数来指定我们自己的列名称:

 import pandas as pd

#specify column names
colnames = [' team ', ' points ', ' rebounds ']

#import Excel file and use specified column names
df = pd. read_excel (' players_data.xlsx ', names = colnames)

#view resulting DataFrame
print (df)

  team points rebounds
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

请注意,Excel 文件的第一行不再用作标题行。

相反,我们使用名称参数指定的列名现在用作列名。

注意:您可以在此处找到 pandas read_excel()函数的完整文档。

其他资源

以下教程解释了如何在 pandas 中执行其他常见任务:

Pandas:如何读取包含合并单元格的 Excel 文件
Pandas:导入 Excel 文件时忽略特定列
Pandas:导入 Excel 文件时如何指定类型
Pandas:如何在读取 Excel 文件时跳行

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注