Pandas:导入 csv 文件时删除特定列


将 CSV 文件导入 pandas DataFrame 时,可以使用以下基本语法删除特定列:

 df = pd. read_csv (' basketball_data.csv ', usecols= lambda x:x != ' rebounds ')

此特定示例会将名为篮球_data.csv 的CSV 文件中的每一列读取到 pandas DataFrame 中,名为篮板的列除外。

以下示例展示了如何在实践中使用此语法。

示例:将 CSV 文件导入 Pandas 时删除特定列

假设我们有以下名为篮球数据.csv的 CSV 文件:

我们可以使用以下语法将 CSV 文件导入 pandas 并在导入过程中删除名为“bounces”的列:

 import pandas as pd

#import all columns except 'rebounds' into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= lambda x:x != ' rebounds ')

#view resulting DataFrame
print (df)

  team points
0 to 22
1 B 14
2 C 29
3 D 30

请注意,当我们将 CSV 文件导入 pandas 时,退回列已被删除。

如果要在导入过程中删除多列,可以使用not in运算符,如下所示:

 import pandas as pd

#import all columns except 'team' and 'rebounds' into DataFrame
df=pd. read_csv (' basketball_data.csv ', usecols= lambda x:x not in [' team ', ' rebounds '])

#view resulting DataFrame
print (df)

   points
0 22
1 14
2 29
3 30

请注意,当我们将 CSV 文件导入 pandas 时,球队篮板列都被删除了。

请注意,您可以在not in运算符后面的列表中包含任意数量的列名称,以便在导入 CSV 文件时删除任意数量的列。

其他资源

以下教程解释了如何在 Python 中执行其他常见任务:

Pandas:如何在读取 CSV 文件时跳行
Pandas:如何将数据添加到现有 CSV 文件
Pandas:如何将 read_csv 与 usecols 参数一起使用

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注