Pandas dataframe に列を挿入する方法
新しい列を pandas DataFrame に挿入したい場合がよくあります。幸いなことに、これは、次の構文を使用する pandas insert()関数を使用して簡単に実行できます。
insert(loc、列、値、allow_duplicates=False)
金:
- loc:列を挿入するインデックス。最初の列は 0 です。
- 列:新しい列に付ける名前。
- value:新しい列の値の配列。
- allow_duplicates:新しい列名が既存の列名と一致することを許可するかどうか。デフォルトは False です。
このチュートリアルでは、この機能の実際の使用例をいくつか示します。
例 1: 新しい列を最初の列として挿入します。
次のコードは、既存の DataFrame の最初の列として新しい列を挿入する方法を示しています。
import pandas as pd #createDataFrame df = pd.DataFrame({'points': [25, 12, 15, 14, 19], 'assists': [5, 7, 7, 9, 12], 'rebounds': [11, 8, 10, 6, 6]}) #view DataFrame df points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6 #insert new column 'player' as first column player_vals = ['A', 'B', 'C', 'D', 'E'] df. insert (loc= 0 , column='player', value=player_vals) df player points assists rebounds 0 to 25 5 11 1 B 12 7 8 2 C 15 7 10 3 D 14 9 6 4 E 19 12 6
例 2: 新しい列を中央の列として挿入します。
次のコードは、既存の DataFrame の 3 番目の列として新しい列を挿入する方法を示しています。
import pandas as pd #createDataFrame df = pd.DataFrame({'points': [25, 12, 15, 14, 19], 'assists': [5, 7, 7, 9, 12], 'rebounds': [11, 8, 10, 6, 6]}) #insert new column 'player' as third column player_vals = ['A', 'B', 'C', 'D', 'E'] df. insert (loc= 2 , column='player', value=player_vals) df points assists player rebounds 0 25 5 A 11 1 12 7 B 8 2 15 7 C 10 3 14 9 D 6 4 19 12 E 6
例 3: 新しい列を最後の列として挿入します。
次のコードは、既存の DataFrame の最後の列として新しい列を挿入する方法を示しています。
import pandas as pd #createDataFrame df = pd.DataFrame({'points': [25, 12, 15, 14, 19], 'assists': [5, 7, 7, 9, 12], 'rebounds': [11, 8, 10, 6, 6]}) #insert new column 'player' as last column player_vals = ['A', 'B', 'C', 'D', 'E'] df. insert (loc= len (df.columns) , column='player', value=player_vals) df points assists player rebounds 0 25 5 A 11 1 12 7 B 8 2 15 7 C 10 3 14 9 D 6 4 19 12 E 6
len(df.columns)を使用すると、含まれる列の数に関係なく、dataFrame の最後の列として新しい列を挿入できることに注意してください。
insert() 関数の完全なドキュメントはここで見つけることができます。