Pandas: як використовувати еквівалент np.where()


Ви можете використовувати функцію NumPy Where() для швидкого оновлення значень масиву NumPy за допомогою логіки if-else.

Наприклад, наступний код показує, як оновити значення в масиві NumPy, який відповідає певній умові:

 import numpy as np

#create NumPy array of values
x = np. array ([1, 3, 3, 6, 7, 9])

#update valuesin array based on condition
x = np. where ((x < 5) | (x > 8), x/2, x)

#view updated array
x

array([0.5, 1.5, 1.5, 6. , 7. , 4.5])

Якщо задане значення в таблиці було менше 5 або більше 8, ми ділимо це значення на 2.

В іншому випадку ми залишаємо значення без змін.

Ми можемо виконати подібну операцію в pandas DataFrame за допомогою функції pandaswhere() , але синтаксис дещо інший.

Ось основний синтаксис використання функції NumPywhere():

 x = np. where (condition, value_if_true, value_if_false)

А ось основний синтаксис використання функції pandaswhere():

 df[' col '] = (value_if_false). where (condition, value_if_true)

У наступному прикладі показано, як використовувати функцію pandaswhere() на практиці.

Приклад: еквівалент np.where() у Pandas

Припустімо, що у нас є наступні pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' B ': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
print (df)

    AB
0 18 5
1 22 7
2 19 7
3 14 9
4 14 12
5 11 9
6 20 9
7 28 4

Ми можемо використовувати наступну функцію pandaswhere() , щоб оновити значення в стовпці A на основі певної умови:

 #update values in column A based on condition
df[' A '] = (df[' A '] / 2). where (df[' A '] < 20, df[' A '] * 2)

#view updated DataFrame
print (df)

      AB
0 9.0 5
1 44.0 7
2 9.5 7
3 7.0 9
4 7.0 12
5 5.5 9
6 40.0 9
7 56.0 4

Якщо задане значення в стовпці A було менше 20, ми множимо значення на 2.

В іншому випадку ми ділимо значення на 2.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в pandas:

Pandas: як підрахувати значення в стовпці з умовою
Pandas: як видалити рядки в DataFrame на основі умови
Pandas: як замінити значення в стовпці на основі умови

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *