Pandas:导入 csv 文件时删除特定列
将 CSV 文件导入 pandas DataFrame 时,可以使用以下基本语法删除特定列:
df = pd. read_csv (' basketball_data.csv ', usecols= lambda x:x != ' rebounds ')
此特定示例会将名为篮球_data.csv 的CSV 文件中的每一列读取到 pandas DataFrame 中,名为篮板的列除外。
以下示例展示了如何在实践中使用此语法。
示例:将 CSV 文件导入 Pandas 时删除特定列
假设我们有以下名为篮球数据.csv的 CSV 文件:
我们可以使用以下语法将 CSV 文件导入 pandas 并在导入过程中删除名为“bounces”的列:
import pandas as pd #import all columns except 'rebounds' into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= lambda x:x != ' rebounds ') #view resulting DataFrame print (df) team points 0 to 22 1 B 14 2 C 29 3 D 30
请注意,当我们将 CSV 文件导入 pandas 时,退回列已被删除。
如果要在导入过程中删除多列,可以使用not in运算符,如下所示:
import pandas as pd #import all columns except 'team' and 'rebounds' into DataFrame df=pd. read_csv (' basketball_data.csv ', usecols= lambda x:x not in [' team ', ' rebounds ']) #view resulting DataFrame print (df) points 0 22 1 14 2 29 3 30
请注意,当我们将 CSV 文件导入 pandas 时,球队和篮板列都被删除了。
请注意,您可以在not in运算符后面的列表中包含任意数量的列名称,以便在导入 CSV 文件时删除任意数量的列。
其他资源
以下教程解释了如何在 Python 中执行其他常见任务:
Pandas:如何在读取 CSV 文件时跳行
Pandas:如何将数据添加到现有 CSV 文件
Pandas:如何将 read_csv 与 usecols 参数一起使用