Cara membuat pandas dataframe dengan data acak
Anda dapat menggunakan sintaks dasar berikut untuk membuat pandas DataFrame yang diisi dengan bilangan bulat acak:
df = pd. DataFrame ( np.random.randint ( 0,100 ,size=( 10,3 )) , columns=list( ' ABC '))
Contoh khusus ini membuat DataFrame dengan 10 baris dan 3 kolom dengan setiap nilai dalam DataFrame adalah bilangan bulat acak antara 0 dan 100 .
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh 1: Buat Pandas DataFrame dengan data acak
Kode berikut menunjukkan cara membuat pandas DataFrame dengan 10 baris dan 3 kolom di mana setiap nilai dalam DataFrame adalah bilangan bulat acak antara 0 dan 100:
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ( np.random.randint ( 0,100 ,size=( 10,3 )), columns=list( ' ABC ') ) #view DataFrame print (df) ABC 0 72 70 27 1 87 85 7 2 4 42 84 3 85 87 63 4 79 72 30 5 96 99 79 6 26 47 90 7 35 69 56 8 42 47 0 9 97 4 59
Perhatikan bahwa setiap kali Anda menjalankan kode ini, bilangan bulat acak di DataFrame akan berbeda.
Jika Anda ingin membuat contoh yang dapat direproduksi dengan bilangan bulat acak yang selalu sama, Anda dapat menggunakan potongan kode berikut segera sebelum membuat DataFrame:
n.p. random . seed ( 0 )
Sekarang, setiap kali Anda menjalankan kode, bilangan bulat acak di DataFrame akan sama.
Contoh 2: Tambahkan Kolom Data Acak ke DataFrame yang Ada
Mari kita asumsikan kita memiliki pandas DataFrame berikut ini:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 A 18 5 11 1 B 22 7 8 2 C 19 7 10 3 D 14 9 6 4 E 14 12 6 5 F 11 9 5 6 G 20 9 9 7:28 4 12
Kita dapat menggunakan kode berikut untuk menambahkan kolom baru bernama “rand” yang berisi bilangan bulat acak antara 0 dan 100:
import numpy as np #add 'rand' column that contains 8 random integers between 0 and 100 df[' rand '] = np. random . randint ( 0,100 , size = ( 8,1 )) #view updated DataFrame print (df) team points assists rebounds rand 0 A 18 5 11 47 1 B 22 7 8 64 2 C 19 7 10 82 3 D 14 9 6 99 4 E 14 12 6 88 5 F 11 9 5 49 6 G 20 9 9 29 7:28 4 12 19
Perhatikan bahwa kolom baru “rand” telah ditambahkan ke DataFrame yang ada.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:
Bagaimana cara memperhitungkan nilai yang hilang di panda
Bagaimana cara mengganti nilai NaN dengan nol di Pandas
Bagaimana cara memeriksa apakah sel kosong di Pandas