Pandas:如何使用第一列作为索引


您可以使用以下方法将第一列用作 pandas DataFrame 中的索引列:

方法一:导入DataFrame时使用第一列作为索引

 df = pd. read_csv (' my_data.csv ', index_col= 0 )

方法 2:使用第一列作为现有 DataFrame 的索引

 df = df. set_index ([' column1 '])

以下示例展示了如何在实践中使用每种方法。

示例1:导入DataFrame时使用第一列作为索引

假设我们有以下名为my_data.csv的 CSV 文件:

如果我们导入 CSV 文件而不指定索引列,pandas 将简单地创建一个索引列,其数值从 0 开始:

 #import CSV file without specifying index column
df = pd. read_csv (' my_data.csv ')

#view DataFrame
print (df)

  team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

但是,我们可以使用index_col参数来指定 CSV 文件的第一列应用作索引列:

 #import CSV file and specify index column
df = pd. read_csv (' my_data.csv ', index_col= 0 )

#view DataFrame
print (df)

      assist points
team                 
At 18 5
B 22 7
C 19 7
D 14 9
E 14 12
F 11 9
G 20 9
H 28 4

请注意,团队列现在用作索引列。

示例 2:使用第一列作为现有 DataFrame 的索引

假设我们有以下现有的 pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
df

team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

我们可以使用set_index()函数将team列设置为索引列:

 #set 'team' column as index column
df = df. set_index ([' team '])

#view updated DataFrame
print (df)

      assist points
team                 
At 18 5
B 22 7
C 19 7
D 14 9
E 14 12
F 11 9
G 20 9
H 28 4

请注意,团队列现在用作索引列。

其他资源

以下教程解释了如何在 pandas 中执行其他常见任务:

如何在 Pandas DataFrame 中按索引选择列
如何重命名 Pandas DataFrame 中的索引
如何在 Pandas 中按索引删除列

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注