Panda: come applicare una funzione a ogni riga in dataframe
È possibile utilizzare la seguente sintassi di base per applicare una funzione a ciascuna riga di un DataFrame panda:
df[' new_col '] = df. apply ( lambda x: some function, axis= 1 )
Questa sintassi applica una funzione a ciascuna riga di un DataFrame panda e restituisce i risultati in una nuova colonna.
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: applicare una funzione a ogni riga in DataFrame
Supponiamo di avere i seguenti panda DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' A ': [5, 4, 7, 9, 12, 9, 9, 4], ' B ': [10, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) AB 0 5 10 1 4 8 2 7 10 3 9 6 4 12 6 5 9 5 6 9 9 7 4 12
Supponiamo ora di voler applicare una funzione che moltiplichi i valori nella colonna A e nella colonna B e poi divida per 2.
Possiamo usare la seguente sintassi per applicare questa funzione a ciascuna riga del DataFrame:
#create new column by applying function to each row in DataFrame
df[' z '] = df. apply ( lambda x: x[' A '] * x[' B '] / 2, axis= 1 )
#view updated DataFrame
print (df)
AB z
0 5 10 25.0
1 4 8 16.0
2 7 10 35.0
3 9 6 27.0
4 12 6 36.0
5 9 5 22.5
6 9 9 40.5
7 4 12 24.0
La colonna z visualizza i risultati della funzione.
Per esempio:
- Prima riga: A * B / 2 = 5 * 10 / 2 = 25
- Seconda riga: A * B / 2 = 4 * 8 / 2 = 16
- Terza riga: A * B / 2 = 7 * 10 / 2 = 35
E così via.
Puoi utilizzare una sintassi simile con lambda per applicare qualsiasi funzione desideri a ciascuna riga di un DataFrame panda.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre operazioni comuni nei panda:
Come applicare una funzione a Pandas Groupby
Come eseguire una somma GroupBy in Pandas
Come utilizzare Groupby e Plot in Pandas