Panda: come utilizzare insieme apply e lambda
È possibile utilizzare la seguente sintassi di base per applicare una funzione lambda a un DataFrame panda:
df[' col '] = df[' col ']. apply ( lambda x: ' value1 ' if x < 20 else ' value2 ')
I seguenti esempi mostrano come utilizzare questa sintassi in pratica con i seguenti DataFrame panda:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]}) #view DataFrame print (df) team points assists 0 to 18 5 1 B 22 7 2 C 19 7 3 D 14 9 4 E 14 12 5 F 11 9 6 G 20 9 7:28 a.m. 4
Esempio 1: utilizzare Apply e Lambda per creare una nuova colonna
Il codice seguente mostra come utilizzare apply e lambda per creare una nuova colonna i cui valori dipendono dai valori di una colonna esistente:
#create new column called 'status'
df[' status '] = df[' points ']. apply ( lambda x: ' Bad ' if x < 20 else ' Good ')
#view updated DataFrame
print (df)
team points assists status
0 A 18 5 Bad
1 B 22 7 Good
2 C 19 7 Bad
3 D 14 9 Bad
4 E 14 12 Bad
5 F 11 9 Bad
6 G 20 9 Good
7:28 4 Good
In questo esempio, abbiamo creato una nuova colonna chiamata status che ha assunto i seguenti valori:
- ‘ Non valido ‘ se il valore nella colonna dei punti era inferiore a 20.
- ‘ Buono ‘ se il valore nella colonna dei punti è maggiore o uguale a 20.
Esempio 2: utilizzare Apply e Lambda per modificare una colonna esistente
Il codice seguente mostra come utilizzare apply e lambda per modificare una colonna esistente nel DataFrame:
#modify existing 'points' column
df[' points '] = df[' points ']. apply ( lambda x: x/2 if x < 20 else x*2)
#view updated DataFrame
print (df)
team points assists
0 to 9.0 5
1 B 44.0 7
2 C 9.5 7
3D 7.0 9
4 E 7.0 12
5 F 5.5 9
6 G 40.0 9
7 A.M. 56.0 4
In questo esempio modifichiamo i valori della colonna punto esistente utilizzando la seguente regola nella funzione lambda:
- Se il valore è inferiore a 20, dividere il valore per 2.
- Se il valore è maggiore o uguale a 20, moltiplicare il valore per 2.
Utilizzando questa funzione lambda, siamo stati in grado di modificare i valori della colonna punto esistente.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre funzioni comuni nei panda:
Come applicare una funzione a Pandas Groupby
Come riempire NaN con valori da un’altra colonna in Pandas