Pandas: como aplicar uma função a cada linha no dataframe
Você pode usar a seguinte sintaxe básica para aplicar uma função a cada linha de um DataFrame do pandas:
df[' new_col '] = df. apply ( lambda x: some function, axis= 1 )
Esta sintaxe aplica uma função a cada linha de um DataFrame do pandas e retorna os resultados em uma nova coluna.
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: Aplicar uma função a cada linha no DataFrame
Suponha que temos o seguinte DataFrame do pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' A ': [5, 4, 7, 9, 12, 9, 9, 4], ' B ': [10, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) AB 0 5 10 1 4 8 2 7 10 3 9 6 4 12 6 5 9 5 6 9 9 7 4 12
Agora suponha que queiramos aplicar uma função que multiplique os valores da coluna A e da coluna B e depois divida por 2.
Podemos usar a seguinte sintaxe para aplicar esta função a cada linha do DataFrame:
#create new column by applying function to each row in DataFrame
df[' z '] = df. apply ( lambda x: x[' A '] * x[' B '] / 2, axis= 1 )
#view updated DataFrame
print (df)
AB z
0 5 10 25.0
1 4 8 16.0
2 7 10 35.0
3 9 6 27.0
4 12 6 36.0
5 9 5 22.5
6 9 9 40.5
7 4 12 24.0
A coluna z exibe os resultados da função.
Por exemplo:
- Primeira linha: A * B / 2 = 5 * 10/2 = 25
- Segunda linha: A * B / 2 = 4 * 8/2 = 16
- Terceira linha: A * B / 2 = 7 * 10/2 = 35
E assim por diante.
Você pode usar sintaxe semelhante com lambda para aplicar qualquer função desejada a cada linha de um DataFrame do pandas.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:
Como aplicar uma função ao Pandas Groupby
Como realizar uma soma GroupBy no Pandas
Como usar Groupby e Plot no Pandas