Pandas:导入excel文件时设置列名
将 Excel 文件导入 pandas 时,可以使用以下基本语法来定义 DataFrame 的列名称:
colnames = [' col1 ', ' col2 ', ' col3 '] df = pd. read_excel (' my_data.xlsx ', names=colnames)
名称参数采用要用于 DataFrame 中的列的名称列表。
通过使用此参数,您还告诉 pandas 使用 Excel 文件的第一行作为 DataFrame 的第一行,而不是将其用作标题行。
以下示例展示了如何在实践中使用此语法。
示例:将 Excel 文件导入 Pandas 时设置列名
假设我们有以下名为Players_data.xlsx的 Excel 文件:
从文件中我们可以看到第一行不包含任何列名。
如果我们使用read_excel()函数导入 Excel 文件,pandas 将尝试使用第一行中的值作为 DataFrame 的列名称:
import pandas as pd #import Excel file df = pd. read_excel (' players_data.xlsx ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10
但是,我们可以在导入 Excel 文件时使用名称参数来指定我们自己的列名称:
import pandas as pd #specify column names colnames = [' team ', ' points ', ' rebounds '] #import Excel file and use specified column names df = pd. read_excel (' players_data.xlsx ', names = colnames) #view resulting DataFrame print (df) team points rebounds 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10
请注意,Excel 文件的第一行不再用作标题行。
相反,我们使用名称参数指定的列名现在用作列名。
注意:您可以在此处找到 pandas read_excel()函数的完整文档。
其他资源
以下教程解释了如何在 pandas 中执行其他常见任务:
Pandas:如何读取包含合并单元格的 Excel 文件
Pandas:导入 Excel 文件时忽略特定列
Pandas:导入 Excel 文件时如何指定类型
Pandas:如何在读取 Excel 文件时跳行