So erstellen sie einen pandas dataframe mit zufallsdaten


Sie können die folgende grundlegende Syntax verwenden, um einen Pandas-DataFrame zu erstellen, der mit zufälligen Ganzzahlen gefüllt ist:

 df = pd. DataFrame ( np.random.randint ( 0,100 ,size=( 10,3 )) , columns=list( ' ABC '))

In diesem speziellen Beispiel wird ein DataFrame mit 10 Zeilen und 3 Spalten erstellt, wobei jeder Wert im DataFrame eine zufällige Ganzzahl zwischen 0 und 100 ist.

Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.

Beispiel 1: Erstellen Sie einen Pandas DataFrame mit zufälligen Daten

Der folgende Code zeigt, wie man einen Pandas-DataFrame mit 10 Zeilen und 3 Spalten erstellt, wobei jeder Wert im DataFrame eine zufällige Ganzzahl zwischen 0 und 100 ist:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ( np.random.randint ( 0,100 ,size=( 10,3 )), columns=list( ' ABC ') ) 

#view DataFrame
print (df)

    ABC
0 72 70 27
1 87 85 7
2 4 42 84
3 85 87 63
4 79 72 30
5 96 99 79
6 26 47 90
7 35 69 56
8 42 47 0
9 97 4 59

Beachten Sie, dass jedes Mal, wenn Sie diesen Code ausführen, die zufälligen Ganzzahlen im DataFrame unterschiedlich sind.

Wenn Sie ein reproduzierbares Beispiel erstellen möchten, bei dem die zufälligen Ganzzahlen jedes Mal gleich sind, können Sie unmittelbar vor der Erstellung des DataFrame den folgenden Codeabschnitt verwenden:

 n.p. random . seed ( 0 )

Jetzt sind die zufälligen Ganzzahlen im DataFrame jedes Mal, wenn Sie den Code ausführen, dieselben.

Beispiel 2: Fügen Sie eine zufällige Datenspalte zu einem vorhandenen DataFrame hinzu

Nehmen wir an, wir haben den folgenden vorhandenen Pandas-DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

Mit dem folgenden Code können wir eine neue Spalte namens „rand“ hinzufügen, die zufällige Ganzzahlen zwischen 0 und 100 enthält:

 import numpy as np

#add 'rand' column that contains 8 random integers between 0 and 100
df[' rand '] = np. random . randint ( 0,100 , size = ( 8,1 ))

#view updated DataFrame
print (df)

  team points assists rebounds rand
0 A 18 5 11 47
1 B 22 7 8 64
2 C 19 7 10 82
3 D 14 9 6 99
4 E 14 12 6 88
5 F 11 9 5 49
6 G 20 9 9 29
7:28 4 12 19

Beachten Sie, dass die neue Spalte „rand“ zum vorhandenen DataFrame hinzugefügt wurde.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

So unterstellen Sie fehlende Werte in Pandas
So ersetzen Sie NaN-Werte in Pandas durch Null
So überprüfen Sie, ob die Zelle in Pandas leer ist

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert