Pandas: 最初の列をインデックスとして使用する方法


次のメソッドを使用して、最初の列を pandas DataFrame のインデックス列として使用できます。

方法 1: DataFrame をインポートするときに最初の列をインデックスとして使用する

 df = pd. read_csv (' my_data.csv ', index_col= 0 )

方法 2: 最初の列を既存の DataFrame のインデックスとして使用する

 df = df. set_index ([' column1 '])

次の例は、各メソッドを実際に使用する方法を示しています。

例 1: DataFrame をインポートするときに最初の列をインデックスとして使用する

my_data.csvという次の CSV ファイルがあるとします。

インデックス列を指定せずに CSV ファイルをインポートすると、パンダは単に 0 から始まる数値を持つインデックス列を作成します。

 #import CSV file without specifying index column
df = pd. read_csv (' my_data.csv ')

#view DataFrame
print (df)

  team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

ただし、 index_col引数を使用して、CSV ファイルの最初の列をインデックス列として使用するように指定できます。

 #import CSV file and specify index column
df = pd. read_csv (' my_data.csv ', index_col= 0 )

#view DataFrame
print (df)

      assist points
team                 
At 18 5
B 22 7
C 19 7
D 14 9
E 14 12
F 11 9
G 20 9
H 28 4

チーム列がインデックス列として使用されるようになったことに注意してください。

例 2: 最初の列を既存の DataFrame のインデックスとして使用する

次の既存の pandas DataFrame があると仮定します。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
df

team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

set_index()関数を使用して、チーム列をインデックス列として設定できます。

 #set 'team' column as index column
df = df. set_index ([' team '])

#view updated DataFrame
print (df)

      assist points
team                 
At 18 5
B 22 7
C 19 7
D 14 9
E 14 12
F 11 9
G 20 9
H 28 4

チーム列がインデックス列として使用されるようになったことに注意してください。

追加リソース

次のチュートリアルでは、パンダで他の一般的なタスクを実行する方法を説明します。

Pandas DataFrame でインデックスによって列を選択する方法
Pandas DataFrame でインデックスの名前を変更する方法
Pandasでインデックスによって列を削除する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です