كيفية إنشاء pandas dataframe ببيانات عشوائية
يمكنك استخدام بناء الجملة الأساسي التالي لإنشاء Pandas DataFrame مملوء بأعداد صحيحة عشوائية:
df = pd. DataFrame ( np.random.randint ( 0,100 ,size=( 10,3 )) , columns=list( ' ABC '))
ينشئ هذا المثال بالتحديد DataFrame مكونًا من 10 صفوف و 3 أعمدة حيث تكون كل قيمة في DataFrame عبارة عن عدد صحيح عشوائي بين 0 و 100 .
توضح الأمثلة التالية كيفية استخدام بناء الجملة هذا عمليًا.
مثال 1: إنشاء Pandas DataFrame ببيانات عشوائية
يوضح التعليمة البرمجية التالية كيفية إنشاء DataFrame الباندا مع 10 صفوف و 3 أعمدة حيث كل قيمة في DataFrame عبارة عن عدد صحيح عشوائي بين 0 و 100:
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ( np.random.randint ( 0,100 ,size=( 10,3 )), columns=list( ' ABC ') ) #view DataFrame print (df) ABC 0 72 70 27 1 87 85 7 2 4 42 84 3 85 87 63 4 79 72 30 5 96 99 79 6 26 47 90 7 35 69 56 8 42 47 0 9 97 4 59
لاحظ أنه في كل مرة تقوم فيها بتشغيل هذا الرمز، ستكون الأعداد الصحيحة العشوائية في DataFrame مختلفة.
إذا كنت تريد إنشاء مثال قابل للتكرار حيث تكون الأعداد الصحيحة العشوائية هي نفسها في كل مرة، فيمكنك استخدام الجزء التالي من التعليمات البرمجية مباشرة قبل إنشاء DataFrame:
n.p. random . seed ( 0 )
الآن، في كل مرة تقوم فيها بتشغيل التعليمات البرمجية، ستكون الأعداد الصحيحة العشوائية في DataFrame هي نفسها.
المثال 2: إضافة عمود بيانات عشوائي إلى DataFrame موجود
لنفترض أن لدينا وحدات DataFrame الموجودة التالية في الباندا:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 A 18 5 11 1 B 22 7 8 2 C 19 7 10 3 D 14 9 6 4 E 14 12 6 5 F 11 9 5 6 G 20 9 9 7:28 4 12
يمكننا استخدام الكود التالي لإضافة عمود جديد يسمى “rand” والذي يحتوي على أعداد صحيحة عشوائية بين 0 و 100:
import numpy as np #add 'rand' column that contains 8 random integers between 0 and 100 df[' rand '] = np. random . randint ( 0,100 , size = ( 8,1 )) #view updated DataFrame print (df) team points assists rebounds rand 0 A 18 5 11 47 1 B 22 7 8 64 2 C 19 7 10 82 3 D 14 9 6 99 4 E 14 12 6 88 5 F 11 9 5 49 6 G 20 9 9 29 7:28 4 12 19
لاحظ أنه تمت إضافة العمود الجديد “rand” إلى DataFrame الموجود.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في الباندا:
كيفية احتساب القيم المفقودة في الباندا
كيفية استبدال قيم NaN بالصفر في Pandas
كيفية التحقق مما إذا كانت الخلية فارغة في الباندا