So erstellen sie einen pandas dataframe mit zufallsdaten
Sie können die folgende grundlegende Syntax verwenden, um einen Pandas-DataFrame zu erstellen, der mit zufälligen Ganzzahlen gefüllt ist:
df = pd. DataFrame ( np.random.randint ( 0,100 ,size=( 10,3 )) , columns=list( ' ABC '))
In diesem speziellen Beispiel wird ein DataFrame mit 10 Zeilen und 3 Spalten erstellt, wobei jeder Wert im DataFrame eine zufällige Ganzzahl zwischen 0 und 100 ist.
Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.
Beispiel 1: Erstellen Sie einen Pandas DataFrame mit zufälligen Daten
Der folgende Code zeigt, wie man einen Pandas-DataFrame mit 10 Zeilen und 3 Spalten erstellt, wobei jeder Wert im DataFrame eine zufällige Ganzzahl zwischen 0 und 100 ist:
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ( np.random.randint ( 0,100 ,size=( 10,3 )), columns=list( ' ABC ') ) #view DataFrame print (df) ABC 0 72 70 27 1 87 85 7 2 4 42 84 3 85 87 63 4 79 72 30 5 96 99 79 6 26 47 90 7 35 69 56 8 42 47 0 9 97 4 59
Beachten Sie, dass jedes Mal, wenn Sie diesen Code ausführen, die zufälligen Ganzzahlen im DataFrame unterschiedlich sind.
Wenn Sie ein reproduzierbares Beispiel erstellen möchten, bei dem die zufälligen Ganzzahlen jedes Mal gleich sind, können Sie unmittelbar vor der Erstellung des DataFrame den folgenden Codeabschnitt verwenden:
n.p. random . seed ( 0 )
Jetzt sind die zufälligen Ganzzahlen im DataFrame jedes Mal, wenn Sie den Code ausführen, dieselben.
Beispiel 2: Fügen Sie eine zufällige Datenspalte zu einem vorhandenen DataFrame hinzu
Nehmen wir an, wir haben den folgenden vorhandenen Pandas-DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 A 18 5 11 1 B 22 7 8 2 C 19 7 10 3 D 14 9 6 4 E 14 12 6 5 F 11 9 5 6 G 20 9 9 7:28 4 12
Mit dem folgenden Code können wir eine neue Spalte namens „rand“ hinzufügen, die zufällige Ganzzahlen zwischen 0 und 100 enthält:
import numpy as np #add 'rand' column that contains 8 random integers between 0 and 100 df[' rand '] = np. random . randint ( 0,100 , size = ( 8,1 )) #view updated DataFrame print (df) team points assists rebounds rand 0 A 18 5 11 47 1 B 22 7 8 64 2 C 19 7 10 82 3 D 14 9 6 99 4 E 14 12 6 88 5 F 11 9 5 49 6 G 20 9 9 29 7:28 4 12 19
Beachten Sie, dass die neue Spalte „rand“ zum vorhandenen DataFrame hinzugefügt wurde.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
So unterstellen Sie fehlende Werte in Pandas
So ersetzen Sie NaN-Werte in Pandas durch Null
So überprüfen Sie, ob die Zelle in Pandas leer ist