Panda: come utilizzare l'equivalente di np.where()
Puoi utilizzare la funzione NumPy Where() per aggiornare rapidamente i valori di un array NumPy utilizzando la logica if-else.
Ad esempio, il codice seguente mostra come aggiornare i valori in un array NumPy che soddisfa una determinata condizione:
import numpy as np #create NumPy array of values x = np. array ([1, 3, 3, 6, 7, 9]) #update valuesin array based on condition x = np. where ((x < 5) | (x > 8), x/2, x) #view updated array x array([0.5, 1.5, 1.5, 6. , 7. , 4.5])
Se un dato valore nella tabella fosse inferiore a 5 o maggiore di 8, dividiamo il valore per 2.
Altrimenti lasciamo invariato il valore.
Possiamo eseguire un’operazione simile in un DataFrame panda utilizzando la funzione pandaswhere() , ma la sintassi è leggermente diversa.
Ecco la sintassi di base che utilizza la funzione NumPywhere():
x = np. where (condition, value_if_true, value_if_false)
Ed ecco la sintassi di base che utilizza la funzione pandaswhere():
df[' col '] = (value_if_false). where (condition, value_if_true)
L’esempio seguente mostra come utilizzare nella pratica la funzione pandaswhere().
Esempio: l’equivalente di np.where() in Panda
Supponiamo di avere i seguenti panda DataFrame:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' A ': [18, 22, 19, 14, 14, 11, 20, 28],
' B ': [5, 7, 7, 9, 12, 9, 9, 4]})
#view DataFrame
print (df)
AB
0 18 5
1 22 7
2 19 7
3 14 9
4 14 12
5 11 9
6 20 9
7 28 4
Possiamo utilizzare la seguente funzione pandaswhere() per aggiornare i valori nella colonna A in base a una condizione specifica:
#update values in column A based on condition
df[' A '] = (df[' A '] / 2). where (df[' A '] < 20, df[' A '] * 2)
#view updated DataFrame
print (df)
AB
0 9.0 5
1 44.0 7
2 9.5 7
3 7.0 9
4 7.0 12
5 5.5 9
6 40.0 9
7 56.0 4
Se un dato valore nella colonna A era inferiore a 20, moltiplicavamo il valore per 2.
Altrimenti dividiamo il valore per 2.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre operazioni comuni nei panda:
Panda: come contare i valori in una colonna con condizione
Panda: come eliminare le righe in DataFrame in base alla condizione
Panda: come sostituire i valori in una colonna in base alla condizione