كيفية استخدام colclasses لاستيراد البيانات بسرعة إلى r
يمكنك استخدام الوسيطة colClasses عند استيراد ملف إلى R لتحديد الفئات لكل عمود:
df <- read. csv (' my_data.csv ', colClasses=c(' character ', ' numeric ', ' numeric '))
تتمثل ميزة استخدام colClasses في أنه يمكنك استيراد البيانات بشكل أسرع، خاصة عندما تكون الملفات كبيرة جدًا.
يوضح المثال التالي كيفية استخدام هذه الوسيطة عمليًا.
مثال: استخدام colClasses عند استيراد الملفات
لنفترض أن لدي ملف CSV يسمى my_data.csv يحتوي على ثلاثة أعمدة أرغب في استيرادها إلى R:
يمكنني استخدام بناء الجملة التالي للقيام بذلك:
#import CSV file
df <- read. csv (' my_data.csv ',
colClasses=c(' character ', ' numeric ', ' numeric '))
#view class of each column in data frame
str(df)
'data.frame': 14 obs. of 3 variables:
$ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
$ points: num 91 99 104 103 105 88 89 93 96 99 ...
$rebounds: num 33 23 26 25 25 26 29 30 34 23 ...
لاحظ أن عدد القيم في وسيطة colClasses يجب أن يتطابق مع عدد الأعمدة في إطار البيانات.
على سبيل المثال، إذا قمت بتوفير قيمة واحدة فقط للوسيطة colClasses ، فسيكون لكل عمود في إطار البيانات نفس الفئة:
#import CSV file
df <- read. csv (' my_data.csv ',
colClasses=c(' character '))
#view class of each column in data frame
str(df)
'data.frame': 14 obs. of 3 variables:
$ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
$ points: chr "91" "99" "104" "103" ...
$rebounds: chr "33" "23" "26" "25" ...
لاحظ أن كل عمود في إطار البيانات الناتج يحتوي على فئة “حرف” نظرًا لأننا قمنا بتوفير قيمة واحدة فقط للوسيطة colClasses .
لاحظ أنه يمكنك تحديد الفئات المحتملة التالية في الوسيطة colClasses :
- الحرف : “مرحبًا”، “هناك”، “العالم”
- مجمع : as.complex(-1)، 4i
- رقمي : as.integer(20)، 3L
- عدد صحيح : 4، 12، 158
- المنطق : صحيح، خطأ
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في R:
كيفية إدخال البيانات الخام يدويًا في R
كيفية استيراد ملفات CSV إلى R
كيفية استيراد ملفات Excel إلى R