パンダ: loc を使用して複数の列を選択する方法


pandas でloc関数を使用すると、ラベルによって DataFrame 内の複数の列を選択できます。

これを行う最も一般的な方法は次のとおりです。

方法 1: 複数の列を名前で選択する

 df. loc [:,[' col2 ',' col4 ']]

方法 2: 範囲内のすべての列を選択します

 df. loc [:, ' col2 ':' col4 ']

次の例は、次の pandas DataFrame で各メソッドを実際に使用する方法を示しています。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' assists ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' rebounds ': [6, 7, 7, 6, 10, 12, 10, 9]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 5 11 6
1 To 7 8 7
2 To 7 10 7
3 to 9 6 6
4 B 12 6 10
5 B 9 5 12
6 B 9 9 10
7 B 4 12 9

例 1: 複数の列を名前で選択する

次のコードは、 loc関数を使用して DataFrame の「ポイント」列と「バウンス」列を選択する方法を示しています。

 #select points and rebounds columns
df. loc [:,[' points ',' rebounds ']]

        rebound points
0 5 6
1 7 7
2 7 7
3 9 6
4 12 10
5 9 12
6 9 10
7 4 9

「ポイント」列と「リバウンド」列の各行が返されることに注意してください。

また、 loc関数で列を指定した順序が、それらの列が返される順序になることに注意してください。

たとえば、最初に「リバウンド」列を返し、次に「ポイント」列を返すことができます。

 #select rebounds and points columns
df. loc [:, [' rebounds ', ' points ']]

	rebound points
0 6 5
1 7 7
2 7 7
3 6 9
4 10 12
5 12 9
6 10 9
7 9 4

例 2: 範囲内のすべての列を選択します

次のコードは、 loc関数を使用して、DataFrame の「points」列と「bounces」列の間にあるすべての列を選択する方法を示しています。

 #select all columns between points and rebounds columns
df. loc [:, ' points ': ' rebounds ']

	points assists rebounds
0 5 11 6
1 7 8 7
2 7 10 7
3 9 6 6
4 12 6 10
5 9 5 12
6 9 9 10
7 4 12 9

DataFrame の「points」列と「bounces」列の間にあるすべての列が返されることに注意してください。

: インデックス位置によって列を選択するには、代わりにiloc関数を使用します。

追加リソース

次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。

Pandas Loc を使用して複数の条件に基づいて行を選択する方法
Pandasで列の値に基づいて行を選択する方法
Pandas でインデックスによって行を選択する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です