Pandas: как использовать apply и lambda вместе


Вы можете использовать следующий базовый синтаксис, чтобы применить лямбда-функцию к DataFrame pandas:

 df[' col '] = df[' col ']. apply ( lambda x: ' value1 ' if x < 20 else ' value2 ')

В следующих примерах показано, как использовать этот синтаксис на практике со следующим DataFrame pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
print (df)

  team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

Пример 1. Используйте Apply и Lambda для создания нового столбца.

Следующий код показывает, как использовать apply и лямбду для создания нового столбца, значения которого зависят от значений существующего столбца:

 #create new column called 'status'
df[' status '] = df[' points ']. apply ( lambda x: ' Bad ' if x < 20 else ' Good ')

#view updated DataFrame
print (df)

  team points assists status
0 A 18 5 Bad
1 B 22 7 Good
2 C 19 7 Bad
3 D 14 9 Bad
4 E 14 12 Bad
5 F 11 9 Bad
6 G 20 9 Good
7:28 4 Good

В этом примере мы создали новый столбец под названием status , который принял следующие значения:

  • « Плохо », если значение в столбце «баллы» было меньше 20.
  • « Хорошо », если значение в столбце «баллы» больше или равно 20.

Пример 2. Используйте Apply и Lambda для изменения существующего столбца.

Следующий код показывает, как использовать apply и лямбда-выражение для изменения существующего столбца в DataFrame:

 #modify existing 'points' column
df[' points '] = df[' points ']. apply ( lambda x: x/2 if x < 20 else x*2)

#view updated DataFrame
print (df)

  team points assists
0 to 9.0 5
1 B 44.0 7
2 C 9.5 7
3D 7.0 9
4 E 7.0 12
5 F 5.5 9
6 G 40.0 9
7 A.M. 56.0 4

В этом примере мы изменяем значения существующего столбца точек , используя следующее правило в лямбда-функции:

  • Если значение меньше 20, разделите значение на 2.
  • Если значение больше или равно 20, умножьте значение на 2.

Используя эту лямбда-функцию, мы смогли изменить значения существующего столбца точек .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные функции в pandas:

Как применить функцию к Pandas Groupby
Как заполнить NaN значениями из другого столбца в Pandas

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *