Pandas: 最初の列をインデックスとして使用する方法

によるベンジャミン・アンダーソン博士 7月 17, 2023 ガイド 0コメント

次のメソッドを使用して、最初の列を pandas DataFrame のインデックス列として使用できます。

方法 1: DataFrame をインポートするときに最初の列をインデックスとして使用する

 df = pd. read_csv (' my_data.csv ', index_col= 0 )

方法 2: 最初の列を既存の DataFrame のインデックスとして使用する

 df = df. set_index ([' column1 '])

次の例は、各メソッドを実際に使用する方法を示しています。

例 1: DataFrame をインポートするときに最初の列をインデックスとして使用する

my_data.csvという次の CSV ファイルがあるとします。

インデックス列を指定せずに CSV ファイルをインポートすると、パンダは単に 0 から始まる数値を持つインデックス列を作成します。

 #import CSV file without specifying index column
df = pd. read_csv (' my_data.csv ')

#view DataFrame
print (df)

  team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

ただし、 index_col引数を使用して、CSV ファイルの最初の列をインデックス列として使用するように指定できます。

 #import CSV file and specify index column
df = pd. read_csv (' my_data.csv ', index_col= 0 )

#view DataFrame
print (df)

      assist points
team                 
At 18 5
B 22 7
C 19 7
D 14 9
E 14 12
F 11 9
G 20 9
H 28 4

チーム列がインデックス列として使用されるようになったことに注意してください。

例 2: 最初の列を既存の DataFrame のインデックスとして使用する

次の既存の pandas DataFrame があると仮定します。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
df

team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

set_index()関数を使用して、チーム列をインデックス列として設定できます。

 #set 'team' column as index column
df = df. set_index ([' team '])

#view updated DataFrame
print (df)

      assist points
team                 
At 18 5
B 22 7
C 19 7
D 14 9
E 14 12
F 11 9
G 20 9
H 28 4

チーム列がインデックス列として使用されるようになったことに注意してください。

追加リソース

次のチュートリアルでは、パンダで他の一般的なタスクを実行する方法を説明します。

Pandas DataFrame でインデックスによって列を選択する方法
 Pandas DataFrame でインデックスの名前を変更する方法
 Pandasでインデックスによって列を削除する方法

著者について

ベンジャミン・アンダーソン博士

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る

例 1: DataFrame をインポートするときに最初の列をインデックスとして使用する

例 2: 最初の列を既存の DataFrame のインデックスとして使用する

追加リソース

著者について

ベンジャミン・アンダーソン博士

コメントを追加する