Pandas で特定の列を保持する方法 (例付き)


次のメソッドを使用して、pandas DataFrame 内の特定の列のみを永続化できます。

方法 1: 保持する列を指定する

 #only keep columns 'col1' and 'col2'
df[[' col1 ', ' col2 ']]

方法 2: 削除する列を指定する

 #drop columns 'col3' and 'col4'
df[df. columns [~df. columns . isin ([' col3 ',' col4 '])]]

次の例は、次の pandas DataFrame で各メソッドを使用する方法を示しています。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'],
                   ' points ': [11, 7, 8, 10, 13, 13],
                   ' assists ': [5, 7, 7, 9, 12, 9],
                   ' rebounds ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

	team points assists rebounds
0 A 11 5 11
1 To 7 7 8
2 to 8 7 10
3 B 10 9 6
4 B 13 12 6
5 B 13 9 5

方法 1: 保持する列を指定する

次のコードは、「チーム」列と「ポイント」列のみを保持する新しいデータフレームを定義する方法を示しています。

 #create new DataFrame and only keep 'team' and 'points' columns
df2 = df[[' team ', ' points ']]

#view new DataFrame
df2

        team points
0 to 11
1 to 7
2 to 8
3 B 10
4 B 13
5 B 13

結果の DataFrame には、指定した 2 つの列のみが保持されることに注意してください。

方法 2: 削除する列を指定する

次のコードは、元の DataFrame から「attends」列と「bounces」列を削除する新しい DataFrame を定義する方法を示しています。

 #create new DataFrame and that drops 'assists' and 'rebounds'
df2 = df[df. columns [~df. columns . isin ([' assists ', ' rebounds '])]]

#view new DataFrame
df2

        team points
0 to 11
1 to 7
2 to 8
3 B 10
4 B 13
5 B 13

結果のデータフレームでは、元のデータフレームから「アシスト」列と「バウンス」列が削除され、残りの列が保持されることに注意してください。

追加リソース

次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。

Pandas DataFrame の最初の列を削除する方法
Pandasで重複した列を削除する方法
Pandasでインデックスによって列を削除する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です