Cara membuat pandas dataframe dengan data acak


Anda dapat menggunakan sintaks dasar berikut untuk membuat pandas DataFrame yang diisi dengan bilangan bulat acak:

 df = pd. DataFrame ( np.random.randint ( 0,100 ,size=( 10,3 )) , columns=list( ' ABC '))

Contoh khusus ini membuat DataFrame dengan 10 baris dan 3 kolom dengan setiap nilai dalam DataFrame adalah bilangan bulat acak antara 0 dan 100 .

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh 1: Buat Pandas DataFrame dengan data acak

Kode berikut menunjukkan cara membuat pandas DataFrame dengan 10 baris dan 3 kolom di mana setiap nilai dalam DataFrame adalah bilangan bulat acak antara 0 dan 100:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ( np.random.randint ( 0,100 ,size=( 10,3 )), columns=list( ' ABC ') ) 

#view DataFrame
print (df)

    ABC
0 72 70 27
1 87 85 7
2 4 42 84
3 85 87 63
4 79 72 30
5 96 99 79
6 26 47 90
7 35 69 56
8 42 47 0
9 97 4 59

Perhatikan bahwa setiap kali Anda menjalankan kode ini, bilangan bulat acak di DataFrame akan berbeda.

Jika Anda ingin membuat contoh yang dapat direproduksi dengan bilangan bulat acak yang selalu sama, Anda dapat menggunakan potongan kode berikut segera sebelum membuat DataFrame:

 n.p. random . seed ( 0 )

Sekarang, setiap kali Anda menjalankan kode, bilangan bulat acak di DataFrame akan sama.

Contoh 2: Tambahkan Kolom Data Acak ke DataFrame yang Ada

Mari kita asumsikan kita memiliki pandas DataFrame berikut ini:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

Kita dapat menggunakan kode berikut untuk menambahkan kolom baru bernama “rand” yang berisi bilangan bulat acak antara 0 dan 100:

 import numpy as np

#add 'rand' column that contains 8 random integers between 0 and 100
df[' rand '] = np. random . randint ( 0,100 , size = ( 8,1 ))

#view updated DataFrame
print (df)

  team points assists rebounds rand
0 A 18 5 11 47
1 B 22 7 8 64
2 C 19 7 10 82
3 D 14 9 6 99
4 E 14 12 6 88
5 F 11 9 5 49
6 G 20 9 9 29
7:28 4 12 19

Perhatikan bahwa kolom baru “rand” telah ditambahkan ke DataFrame yang ada.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:

Bagaimana cara memperhitungkan nilai yang hilang di panda
Bagaimana cara mengganti nilai NaN dengan nol di Pandas
Bagaimana cara memeriksa apakah sel kosong di Pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *