كيفية استخدام fread() في r لاستيراد الملفات بشكل أسرع
يمكنك استخدام الدالة fread() لحزمة data.table في R لاستيراد الملفات بسرعة وسهولة.
تستخدم هذه الوظيفة بناء الجملة الأساسي التالي:
library (data.table) df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ")
بالنسبة للملفات الكبيرة، وجد أن هذه الوظيفة أسرع بكثير من الوظائف مثل read.csv من قاعدة R.
وفي معظم الحالات، يمكن لهذه الوظيفة أيضًا اكتشاف أنواع المحددات والأعمدة لمجموعة البيانات التي تقوم باستيرادها تلقائيًا.
يوضح المثال التالي كيفية استخدام هذه الوظيفة عمليًا.
مثال: كيفية استخدام Feed() لاستيراد الملفات إلى R
لنفترض أن لدي ملف CSV يسمى data.csv محفوظًا في الموقع التالي:
C:\Users\Bob\Desktop\data.csv
وافترض أن ملف CSV يحتوي على البيانات التالية:
team, points, assists 'A', 78, 12 'B', 85, 20 'C', 93, 23 'D', 90, 8 'E', 91, 14
يمكنني استخدام الدالة fread() لحزمة data.table لاستيراد هذا الملف إلى بيئة R الحالية الخاصة بي:
library (data.table) #import data df <- fread("C:\Users\Bob\Desktop\data.csv") #viewdata df team points assists 1 A 78 12 2 B 85 20 3 C 93 23 4 D 90 8 5 E 91 14
نحن قادرون على استيراد ملف CSV بنجاح باستخدام وظيفة fread() .
ملاحظة : استخدمنا خطوط مائلة عكسية مزدوجة (\\) في مسار الملف لتجنب خطأ الاستيراد الشائع .
لاحظ أننا أيضًا لم نكن بحاجة إلى تحديد المحدد نظرًا لأن الدالة fread() اكتشفت تلقائيًا أنه كان فاصلة.
إذا استخدمنا الدالة str() لعرض بنية إطار البيانات، فيمكننا أن نرى أن الدالة fread() قد حددت أيضًا نوع الكائن تلقائيًا لكل عمود:
#view structure of data
str(df)
Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
$ team: chr "'A'" "'B'" "'C'" "'D'" ...
$points: int 78 85 93 90 91
$assists: int 12 20 23 8 14
ومن النتيجة يمكننا أن نرى:
- متغير الفريق هو حرف.
- متغير النقاط هو عدد صحيح.
- المتغير المساعد هو عدد صحيح.
في هذا المثال، استخدمنا إطار بيانات صغيرًا للتبسيط (5 صفوف × 3 أعمدة)، ولكن عمليًا، تكون وظيفة fread() قادرة على استيراد كتل البيانات التي تحتوي على عشرات الآلاف من الصفوف بسرعة وكفاءة، مما يجعلها طريقة الاستيراد المفضلة لمجموعات البيانات واسعة النطاق.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية استيراد أنواع ملفات محددة إلى R:
كيفية استيراد ملفات Excel إلى R
كيفية استيراد ملفات TSV إلى R
كيفية استيراد الملفات المضغوطة إلى R
كيفية استيراد ملفات SAS إلى R
كيفية استيراد ملفات .dta إلى R