كيفية استيراد ملفات csv إلى r (خطوة بخطوة)


لنفترض أن لدي ملف CSV يسمى data.csv محفوظًا في الموقع التالي:

C:\Users\Bob\Desktop\data.csv

وافترض أن ملف CSV يحتوي على البيانات التالية:

 team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

هناك ثلاث طرق شائعة لاستيراد ملف CSV هذا إلى R:

1. استخدم read.csv من قاعدة R (أبطأ طريقة، ولكنها تعمل بشكل جيد مع مجموعات البيانات الأصغر)

 data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE )

2. استخدم read_csv من حزمة readr (أسرع 2-3 مرات من read.csv)

 library (readr)

data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ")

3. استخدم الحزمة من data.table (أسرع 2-3 مرات من read_csv)

 library (data.table)

data3 <- fread(" C:\Users\Bob\Desktop\data.csv ")

يعرض هذا البرنامج التعليمي مثالاً لاستخدام كل من هذه الطرق لاستيراد ملف CSV إلى R.

الطريقة الأولى: استخدام read.csv

إذا كان ملف CSV الخاص بك صغيرًا بشكل معقول، فيمكنك ببساطة استخدام وظيفة read.csv الخاصة بـ Base R لاستيراده.

عند استخدام هذه الطريقة، تأكد من تحديد stringsAsFactors=FALSE بحيث لا يقوم R بتحويل المتغيرات الأبجدية أو الفئوية إلى عوامل.

يوضح التعليمة البرمجية التالية كيفية استخدام read.csv لاستيراد ملف CSV هذا إلى R:

 #import data
data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE )

#view structure of data
str(data1)

'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

الطريقة الثانية: استخدام read_csv

إذا كنت تعمل مع ملفات أكبر حجمًا، فيمكنك استخدام وظيفة read_csv الموجودة في حزمة readr:

 library (readr)

#import data
data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ")

#view structure of data
str(data2)

'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

الطريقة الثالثة: استخدام التغذية

إذا كان ملف CSV كبيرًا جدًا، فإن أسرع طريقة لاستيراده إلى R هي استخدام الدالة fread في الحزمة data.table:

 library (data.table)

#import data
data3 <- fread(" C:\Users\Bob\Desktop\data.csv ")

#view structure of data
str(data3)

Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

لاحظ أننا في كل مثال استخدمنا خطوط مائلة عكسية مزدوجة (\\) في مسار الملف لتجنب الخطأ الشائع التالي:

 Error: '\U' used without hex digits in character string starting ""C:\U"

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية استيراد أنواع الملفات الأخرى إلى R:

كيفية استيراد ملفات Excel إلى R
كيفية استيراد ملفات TSV إلى R
كيفية استيراد الملفات المضغوطة إلى R
كيفية استيراد ملفات SAS إلى R
كيفية استيراد ملفات .dta إلى R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *