Pandas apply() を適切に使用する方法


pandas apply()関数を使用すると、pandas DataFrame の行または列に関数を適用できます。

この関数は、インプレース引数を提供するDrop()replace()などの他の関数とは異なります。

 df. drop ([' column1 '], inplace= True )

df. rename ({' old_column ': ' new_column '}, inplace= True )

apply()関数にはインプレース引数がないため、インプレース データフレームを変換するには次の構文を使用する必要があります。

 df = df. apply ( lambda x: x* 2 )

次の例は、実際に次の pandas DataFrame でこの構文を使用する方法を示しています。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

        points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6
5 23 9 5
6 25 9 9
7 29 4 12

例 1: 列の代わりに apply() を使用する

次のコードは、 apply()を使用してデータ フレーム列をその場で変換する方法を示しています。

 #multiply all values in 'points' column by 2 in place
df. loc [:, ' points '] = df. points . apply ( lambda x: x* 2 )

#view updated DataFrame
df

points assists rebounds
0 50 5 11
1 24 7 8
2 30 7 10
3 28 9 6
4 38 12 6
5 46 9 5
6 50 9 9
7 58 4 12

例 2: 複数の列の代わりに apply() を使用する

次のコードは、 apply()を使用して複数のデータ フレーム列をその場で変換する方法を示しています。

 multiply all values in 'points' and 'rebounds' column by 2 in place
df[[' points ', ' rebounds ']] = df[[' points ', ' rebounds ']]. apply ( lambda x: x* 2 )

#view updated DataFrame
df

	points assists rebounds
0 50 5 22
1 24 7 16
2 30 7 20
3 28 9 12
4 38 12 12
5 46 9 10
6 50 9 18
7 58 4 24

例 3: すべての列に対して apply() を使用する

次のコードは、 apply()を使用して、データ フレーム内のすべての列をその場で変換する方法を示しています。

 #multiply values in all columns by 2
df = df. apply ( lambda x: x* 2 )

#view updated DataFrame
df

	points assists rebounds
0 50 10 22
1 24 14 16
2 30 14 20
3 28 18 12
4 38 24 12
5 46 18 10
6 50 18 18
7 58 8 24

追加リソース

次のチュートリアルでは、パンダで他の一般的な機能を実行する方法を説明します。

Pandasで列の合計を計算する方法
Pandas で列の平均を計算する方法
Pandasで列の最大値を見つける方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です