Pandas: як застосувати функцію до кожного рядка в dataframe


Ви можете використовувати наступний базовий синтаксис, щоб застосувати функцію до кожного рядка pandas DataFrame:

 df[' new_col '] = df. apply ( lambda x: some function, axis= 1 )

Цей синтаксис застосовує функцію до кожного рядка pandas DataFrame і повертає результати в новому стовпці.

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: застосувати функцію до кожного рядка в DataFrame

Припустімо, що у нас є наступні pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A ': [5, 4, 7, 9, 12, 9, 9, 4],
                   ' B ': [10, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

    AB
0 5 10
1 4 8
2 7 10
3 9 6
4 12 6
5 9 5
6 9 9
7 4 12

Тепер припустімо, що ми хочемо застосувати функцію, яка множить значення в стовпцях A і B, а потім ділить на 2.

Ми можемо використовувати такий синтаксис, щоб застосувати цю функцію до кожного рядка DataFrame:

 #create new column by applying function to each row in DataFrame
df[' z '] = df. apply ( lambda x: x[' A '] * x[' B '] / 2, axis= 1 )

#view updated DataFrame
print (df)

    AB z
0 5 10 25.0
1 4 8 16.0
2 7 10 35.0
3 9 6 27.0
4 12 6 36.0
5 9 5 22.5
6 9 9 40.5
7 4 12 24.0

Стовпець z відображає результати функції.

Наприклад:

  • Перший ряд: A * B / 2 = 5 * 10 / 2 = 25
  • Другий ряд: A * B / 2 = 4 * 8 / 2 = 16
  • Третій ряд: А * Б / 2 = 7 * 10 / 2 = 35

І так далі.

Ви можете використовувати подібний синтаксис із лямбда-кодом , щоб застосувати будь-яку функцію, яку хочете, до кожного рядка pandas DataFrame.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в pandas:

Як застосувати функцію до Pandas Groupby
Як виконати суму GroupBy у Pandas
Як використовувати Groupby та Plot у Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *