So verwenden sie die methode „assign()“ in pandas (mit beispielen)
Mit der Methode „assign()“ können neue Spalten zu einem Pandas-DataFrame hinzugefügt werden.
Diese Methode verwendet die folgende grundlegende Syntax:
df. assign (new_column = values)
Es ist wichtig zu beachten, dass diese Methode nur den neuen DataFrame auf der Konsole anzeigt, den ursprünglichen DataFrame jedoch nicht tatsächlich ändert.
Um den ursprünglichen DataFrame zu ändern, müssen Sie die Ergebnisse der Methode „assign()“ in einer neuen Variablen speichern.
Die folgenden Beispiele zeigen, wie Sie die Methode „assign()“ auf unterschiedliche Weise mit dem folgenden Pandas-DataFrame verwenden:
import pandas as pd #define DataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6 5 23 9 5 6 25 9 9 7 29 4 12
Beispiel 1: Weisen Sie DataFrame eine neue Variable zu
Der folgende Code zeigt, wie Sie mit der Methode „assign()“ eine neue Variable namens „ points2“ zum DataFrame hinzufügen, deren Werte gleich den Werten in der Punktespalte multipliziert mit zwei sind:
#add new variable called points2
df. assign (points2 = df.points * 2 )
points assists rebounds points2
0 25 5 11 50
1 12 7 8 24
2 15 7 10 30
3 14 9 6 28
4 19 12 6 38
5 23 9 5 46
6 25 9 9 50
7 29 4 12 58
Beachten Sie, dass diese Methode „assign()“ den ursprünglichen DataFrame nicht ändert.
Wenn wir den ursprünglichen DataFrame drucken, werden wir sehen, dass er unverändert bleibt:
#print original DataFrame print (df) points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6 5 23 9 5 6 25 9 9 7 29 4 12
Um die Ergebnisse der Methode „assign()“ zu speichern, können wir die Ergebnisse in einem neuen DataFrame speichern:
#add new variable called points2 and save results in new DataFrame
df. assign (points2 = df.points * 2 )
#view new DataFrame
print (df_new)
points assists rebounds points2
0 25 5 11 50
1 12 7 8 24
2 15 7 10 30
3 14 9 6 28
4 19 12 6 38
5 23 9 5 46
6 25 9 9 50
7 29 4 12 58
Der neue DataFrame namens df_new enthält jetzt die von uns erstellte Spalte „points2“ .
Beispiel 2: Weisen Sie DataFrame mehrere neue Variablen zu
Der folgende Code zeigt, wie Sie mit der Methode „assign()“ drei neue Variablen zum DataFrame hinzufügen:
#add three new variables to DataFrame and store results in new DataFrame df_new = df. assign (points2 = df. points * 2 , assists_rebs = df. assists + df. rebounds , conference = ' Western ') #view new DataFrame print (df_new) points assists rebounds points2 assists_rebs conference 0 25 5 11 50 16 Western 1 12 7 8 24 15 Western 2 15 7 10 30 17 Western 3 14 9 6 28 15 Western 4 19 12 6 38 18 Western 5 23 9 5 46 14 Western 6 25 9 9 50 18 Western 7 29 4 12 58 16 Western
Beachten Sie, dass dem DataFrame drei neue Spalten hinzugefügt wurden.
Hinweis : Die vollständige Dokumentation der Pandas-Methode „assign()“ finden Sie hier .
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere allgemeine Funktionen in Pandas verwenden:
So verwenden Sie die Funktion „beschreiben()“ in Pandas
So verwenden Sie die Funktion idxmax() in Pandas
So wenden Sie eine Funktion auf ausgewählte Spalten in Pandas an