Pandas apply() を適切に使用する方法
pandas apply()関数を使用すると、pandas DataFrame の行または列に関数を適用できます。
この関数は、インプレース引数を提供するDrop()やreplace()などの他の関数とは異なります。
df. drop ([' column1 '], inplace= True ) df. rename ({' old_column ': ' new_column '}, inplace= True )
apply()関数にはインプレース引数がないため、インプレース データフレームを変換するには次の構文を使用する必要があります。
df = df. apply ( lambda x: x* 2 )
次の例は、実際に次の pandas DataFrame でこの構文を使用する方法を示しています。
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame df points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6 5 23 9 5 6 25 9 9 7 29 4 12
例 1: 列の代わりに apply() を使用する
次のコードは、 apply()を使用してデータ フレーム列をその場で変換する方法を示しています。
#multiply all values in 'points' column by 2 in place df. loc [:, ' points '] = df. points . apply ( lambda x: x* 2 ) #view updated DataFrame df points assists rebounds 0 50 5 11 1 24 7 8 2 30 7 10 3 28 9 6 4 38 12 6 5 46 9 5 6 50 9 9 7 58 4 12
例 2: 複数の列の代わりに apply() を使用する
次のコードは、 apply()を使用して複数のデータ フレーム列をその場で変換する方法を示しています。
multiply all values in 'points' and 'rebounds' column by 2 in place df[[' points ', ' rebounds ']] = df[[' points ', ' rebounds ']]. apply ( lambda x: x* 2 ) #view updated DataFrame df points assists rebounds 0 50 5 22 1 24 7 16 2 30 7 20 3 28 9 12 4 38 12 12 5 46 9 10 6 50 9 18 7 58 4 24
例 3: すべての列に対して apply() を使用する
次のコードは、 apply()を使用して、データ フレーム内のすべての列をその場で変換する方法を示しています。
#multiply values in all columns by 2 df = df. apply ( lambda x: x* 2 ) #view updated DataFrame df points assists rebounds 0 50 10 22 1 24 14 16 2 30 14 20 3 28 18 12 4 38 24 12 5 46 18 10 6 50 18 18 7 58 8 24
追加リソース
次のチュートリアルでは、パンダで他の一般的な機能を実行する方法を説明します。
Pandasで列の合計を計算する方法
Pandas で列の平均を計算する方法
Pandasで列の最大値を見つける方法