Pandas:导入 csv 文件时设置列名称
将 CSV 文件导入 pandas 时,可以使用以下基本语法来定义 DataFrame 的列名称:
colnames = [' col1 ', ' col2 ', ' col3 '] df = pd. read_csv (' my_data.csv ', names=colnames)
名称参数采用要用于 DataFrame 中的列的名称列表。
通过使用此参数,您还告诉 pandas 使用 CSV 文件的第一行作为 DataFrame 的第一行,而不是将其用作标题行。
以下示例展示了如何在实践中使用此语法。
示例:将 CSV 文件导入 Pandas 时设置列名称
假设我们有以下名为Players_data.csv的 CSV 文件:
从文件中我们可以看到第一行不包含任何列名。
如果我们使用read_csv()函数导入 CSV 文件,pandas 将尝试使用第一行中的值作为 DataFrame 的列名称:
import pandas as pd #import CSV file df = pd. read_csv (' players_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10
但是,我们可以在导入 CSV 文件时使用名称参数来指定我们自己的列名称:
import pandas as pd #specify column names colnames = [' team ', ' points ', ' rebounds '] #import CSV file and use specified column names df = pd. read_csv (' players_data.csv ', names = colnames) #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
请注意,CSV 文件的第一行不再用作标题行。
相反,我们使用名称参数指定的列名现在用作列名。
注意:您可以在此处找到 pandas read_csv()函数的完整文档。
其他资源
以下教程解释了如何在 Python 中执行其他常见任务:
Pandas:如何在读取 CSV 文件时跳行
Pandas:如何将数据添加到现有 CSV 文件
Pandas:如何将 read_csv 与 usecols 参数一起使用