Pandas:如何使用第一列作为索引
您可以使用以下方法将第一列用作 pandas DataFrame 中的索引列:
方法一:导入DataFrame时使用第一列作为索引
df = pd. read_csv (' my_data.csv ', index_col= 0 )
方法 2:使用第一列作为现有 DataFrame 的索引
df = df. set_index ([' column1 '])
以下示例展示了如何在实践中使用每种方法。
示例1:导入DataFrame时使用第一列作为索引
假设我们有以下名为my_data.csv的 CSV 文件:
如果我们导入 CSV 文件而不指定索引列,pandas 将简单地创建一个索引列,其数值从 0 开始:
#import CSV file without specifying index column df = pd. read_csv (' my_data.csv ') #view DataFrame print (df) team points assists 0 to 18 5 1 B 22 7 2 C 19 7 3 D 14 9 4 E 14 12 5 F 11 9 6 G 20 9 7:28 a.m. 4
但是,我们可以使用index_col参数来指定 CSV 文件的第一列应用作索引列:
#import CSV file and specify index column df = pd. read_csv (' my_data.csv ', index_col= 0 ) #view DataFrame print (df) assist points team At 18 5 B 22 7 C 19 7 D 14 9 E 14 12 F 11 9 G 20 9 H 28 4
请注意,团队列现在用作索引列。
示例 2:使用第一列作为现有 DataFrame 的索引
假设我们有以下现有的 pandas DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]}) #view DataFrame df team points assists 0 to 18 5 1 B 22 7 2 C 19 7 3 D 14 9 4 E 14 12 5 F 11 9 6 G 20 9 7:28 a.m. 4
我们可以使用set_index()函数将team列设置为索引列:
#set 'team' column as index column df = df. set_index ([' team ']) #view updated DataFrame print (df) assist points team At 18 5 B 22 7 C 19 7 D 14 9 E 14 12 F 11 9 G 20 9 H 28 4
请注意,团队列现在用作索引列。
其他资源
以下教程解释了如何在 pandas 中执行其他常见任务:
如何在 Pandas DataFrame 中按索引选择列
如何重命名 Pandas DataFrame 中的索引
如何在 Pandas 中按索引删除列