วิธีสร้าง pandas dataframe ด้วยข้อมูลแบบสุ่ม


คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อสร้าง DataFrame แพนด้าที่เต็มไปด้วยจำนวนเต็มแบบสุ่ม:

 df = pd. DataFrame ( np.random.randint ( 0,100 ,size=( 10,3 )) , columns=list( ' ABC '))

ตัวอย่างนี้สร้าง DataFrame ที่มี 10 แถวและ 3 คอลัมน์ โดยที่แต่ละค่าใน DataFrame เป็นจำนวนเต็มสุ่มระหว่าง 0 ถึง 100

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่างที่ 1: สร้าง Pandas DataFrame ด้วยข้อมูลแบบสุ่ม

รหัสต่อไปนี้แสดงวิธีการสร้าง DataFrame แพนด้าที่มี 10 แถวและ 3 คอลัมน์โดยที่แต่ละค่าใน DataFrame เป็นจำนวนเต็มสุ่มระหว่าง 0 ถึง 100:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ( np.random.randint ( 0,100 ,size=( 10,3 )), columns=list( ' ABC ') ) 

#view DataFrame
print (df)

    ABC
0 72 70 27
1 87 85 7
2 4 42 84
3 85 87 63
4 79 72 30
5 96 99 79
6 26 47 90
7 35 69 56
8 42 47 0
9 97 4 59

โปรดทราบว่าแต่ละครั้งที่คุณเรียกใช้โค้ดนี้ จำนวนเต็มสุ่มใน DataFrame จะแตกต่างกัน

หากคุณต้องการสร้างตัวอย่างที่ทำซ้ำได้ โดยที่จำนวนเต็มสุ่มจะเท่ากันทุกครั้ง คุณสามารถใช้โค้ดต่อไปนี้ทันทีก่อนที่จะสร้าง DataFrame:

 n.p. random . seed ( 0 )

ตอนนี้ ทุกครั้งที่คุณรันโค้ด จำนวนเต็มสุ่มใน DataFrame จะเท่ากัน

ตัวอย่างที่ 2: เพิ่มคอลัมน์ข้อมูลแบบสุ่มลงใน DataFrame ที่มีอยู่

สมมติว่าเรามี DataFrame แพนด้าที่มีอยู่ดังต่อไปนี้:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

เราสามารถใช้โค้ดต่อไปนี้เพื่อเพิ่มคอลัมน์ใหม่ที่เรียกว่า “rand” ซึ่งมีจำนวนเต็มสุ่มระหว่าง 0 ถึง 100:

 import numpy as np

#add 'rand' column that contains 8 random integers between 0 and 100
df[' rand '] = np. random . randint ( 0,100 , size = ( 8,1 ))

#view updated DataFrame
print (df)

  team points assists rebounds rand
0 A 18 5 11 47
1 B 22 7 8 64
2 C 19 7 10 82
3 D 14 9 6 99
4 E 14 12 6 88
5 F 11 9 5 49
6 G 20 9 9 29
7:28 4 12 19

โปรดทราบว่ามีการเพิ่มคอลัมน์ใหม่ “rand” ใน DataFrame ที่มีอยู่แล้ว

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่น ๆ ในแพนด้า:

วิธีใส่ค่าที่หายไปในแพนด้า
วิธีแทนที่ค่า NaN ด้วยศูนย์ใน Pandas
วิธีตรวจสอบว่าเซลล์ว่างใน Pandas หรือไม่

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *