Pandas: so verwenden sie das äquivalent von np.where()


Sie können die Funktion NumPy Where() verwenden, um die Werte eines NumPy-Arrays mithilfe der If-Else-Logik schnell zu aktualisieren.

Der folgende Code zeigt beispielsweise, wie Werte in einem NumPy-Array aktualisiert werden, die eine bestimmte Bedingung erfüllen:

 import numpy as np

#create NumPy array of values
x = np. array ([1, 3, 3, 6, 7, 9])

#update valuesin array based on condition
x = np. where ((x < 5) | (x > 8), x/2, x)

#view updated array
x

array([0.5, 1.5, 1.5, 6. , 7. , 4.5])

Wenn ein bestimmter Wert in der Tabelle kleiner als 5 oder größer als 8 war, teilen wir den Wert durch 2.

Ansonsten lassen wir den Wert unverändert.

Wir können einen ähnlichen Vorgang in einem Pandas-DataFrame mit der Funktion pandaswhere() ausführen, aber die Syntax ist etwas anders.

Hier ist die grundlegende Syntax für die Verwendung der NumPywhere()-Funktion:

 x = np. where (condition, value_if_true, value_if_false)

Und hier ist die grundlegende Syntax mit der Funktion pandaswhere():

 df[' col '] = (value_if_false). where (condition, value_if_true)

Das folgende Beispiel zeigt, wie die Funktion pandaswhere() in der Praxis verwendet wird.

Beispiel: das Äquivalent von np.where() in Pandas

Angenommen, wir haben den folgenden Pandas-DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' B ': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
print (df)

    AB
0 18 5
1 22 7
2 19 7
3 14 9
4 14 12
5 11 9
6 20 9
7 28 4

Wir können die folgende Funktion pandaswhere() verwenden, um die Werte in Spalte A basierend auf einer bestimmten Bedingung zu aktualisieren:

 #update values in column A based on condition
df[' A '] = (df[' A '] / 2). where (df[' A '] < 20, df[' A '] * 2)

#view updated DataFrame
print (df)

      AB
0 9.0 5
1 44.0 7
2 9.5 7
3 7.0 9
4 7.0 12
5 5.5 9
6 40.0 9
7 56.0 4

Wenn ein bestimmter Wert in Spalte A kleiner als 20 war, haben wir den Wert mit 2 multipliziert.

Ansonsten haben wir den Wert durch 2 geteilt.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

Pandas: So zählen Sie Werte in einer Spalte mit Bedingung
Pandas: So löschen Sie Zeilen in DataFrame basierend auf der Bedingung
Pandas: So ersetzen Sie Werte in einer Spalte basierend auf der Bedingung

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert