Pandas で特定の列を保持する方法 (例付き)
次のメソッドを使用して、pandas DataFrame 内の特定の列のみを永続化できます。
方法 1: 保持する列を指定する
#only keep columns 'col1' and 'col2' df[[' col1 ', ' col2 ']]
方法 2: 削除する列を指定する
#drop columns 'col3' and 'col4' df[df. columns [~df. columns . isin ([' col3 ',' col4 '])]]
次の例は、次の pandas DataFrame で各メソッドを使用する方法を示しています。
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'], ' points ': [11, 7, 8, 10, 13, 13], ' assists ': [5, 7, 7, 9, 12, 9], ' rebounds ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team points assists rebounds 0 A 11 5 11 1 To 7 7 8 2 to 8 7 10 3 B 10 9 6 4 B 13 12 6 5 B 13 9 5
方法 1: 保持する列を指定する
次のコードは、「チーム」列と「ポイント」列のみを保持する新しいデータフレームを定義する方法を示しています。
#create new DataFrame and only keep 'team' and 'points' columns
df2 = df[[' team ', ' points ']]
#view new DataFrame
df2
team points
0 to 11
1 to 7
2 to 8
3 B 10
4 B 13
5 B 13
結果の DataFrame には、指定した 2 つの列のみが保持されることに注意してください。
方法 2: 削除する列を指定する
次のコードは、元の DataFrame から「attends」列と「bounces」列を削除する新しい DataFrame を定義する方法を示しています。
#create new DataFrame and that drops 'assists' and 'rebounds'
df2 = df[df. columns [~df. columns . isin ([' assists ', ' rebounds '])]]
#view new DataFrame
df2
team points
0 to 11
1 to 7
2 to 8
3 B 10
4 B 13
5 B 13
結果のデータフレームでは、元のデータフレームから「アシスト」列と「バウンス」列が削除され、残りの列が保持されることに注意してください。
追加リソース
次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。
Pandas DataFrame の最初の列を削除する方法
Pandasで重複した列を削除する方法
Pandasでインデックスによって列を削除する方法