パンダ: np.where() と同等のものを使用する方法


NumPy Where()関数を使用すると、if-else ロジックを使用して NumPy 配列の値を迅速に更新できます。

たとえば、次のコードは、特定の条件を満たす NumPy 配列の値を更新する方法を示しています。

 import numpy as np

#create NumPy array of values
x = np. array ([1, 3, 3, 6, 7, 9])

#update valuesin array based on condition
x = np. where ((x < 5) | (x > 8), x/2, x)

#view updated array
x

array([0.5, 1.5, 1.5, 6. , 7. , 4.5])

テーブル内の特定の値が 5 未満または 8 より大きい場合、その値を 2 で割ります。

それ以外の場合は、値を変更しないままにします。

pandaswhere()関数を使用して、pandas DataFrame で同様の操作を実行できますが、構文は若干異なります。

NumPywhere() 関数を使用した基本的な構文は次のとおりです。

 x = np. where (condition, value_if_true, value_if_false)

pandaswhere() 関数を使用した基本的な構文は次のとおりです。

 df[' col '] = (value_if_false). where (condition, value_if_true)

次の例は、実際に pandaswhere() 関数を使用する方法を示しています。

例: Pandas の np.where() に相当します。

次のパンダ データフレームがあるとします。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' B ': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
print (df)

    AB
0 18 5
1 22 7
2 19 7
3 14 9
4 14 12
5 11 9
6 20 9
7 28 4

次のpandaswhere()関数を使用して、特定の条件に基づいて列 A の値を更新できます。

 #update values in column A based on condition
df[' A '] = (df[' A '] / 2). where (df[' A '] < 20, df[' A '] * 2)

#view updated DataFrame
print (df)

      AB
0 9.0 5
1 44.0 7
2 9.5 7
3 7.0 9
4 7.0 12
5 5.5 9
6 40.0 9
7 56.0 4

列 A の特定の値が 20 未満の場合、その値を 2 で乗算しました。

それ以外の場合は、値を 2 で除算します。

追加リソース

次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。

Pandas: 条件付きで列の値をカウントする方法
Pandas: 条件に基づいて DataFrame の行を削除する方法
Pandas: 条件に基づいて列の値を置換する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です