الدليل النهائي: كيفية قراءة ملفات csv باستخدام pandas
تعد ملفات CSV (قيمة مفصولة بفواصل) إحدى الطرق الأكثر شيوعًا لتخزين البيانات.
لحسن الحظ، تتيح لك وظيفة Pandas read_csv () قراءة ملفات CSV بسهولة في Python بأي تنسيق تريده تقريبًا.
يشرح هذا البرنامج التعليمي عدة طرق لقراءة ملفات CSV في Python باستخدام ملف CSV التالي المسمى “data.csv” :
playerID,team,points 1,Lakers,26 2,Mavs,19 3,Bucks,24 4,Spurs,22
مثال 1: اقرأ ملف CSV في ملف pandas DataFrame
يوضح التعليمة البرمجية التالية كيفية قراءة ملف CSV في pandas DataFrame:
#import CSV file as DataFrame df = pd. read_csv ('data.csv') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
مثال 2: قراءة أعمدة محددة من ملف CSV
يوضح التعليمة البرمجية التالية كيفية قراءة الأعمدة المسماة “playerID” و”النقاط” من ملف CSV فقط في pandas DataFrame:
#import only specific columns from CSV file df = pd. read_csv ('data.csv', usecols=[' playerID ',' points ']) #view DataFrame df playerID points 0 1 26 1 2 19 2 3 24 3 4 22
يمكنك أيضًا تحديد فهارس الأعمدة لقراءتها في Pandas DataFrame:
#import only specific columns from CSV file df = pd. read_csv (' data.csv ', usecols=[ 0,1 ]) #view DataFrame df playerID team 0 1 Lakers 1 2 Mavs 2 3 Bucks 3 4 Spurs
مثال 3: حدد صف الرأس عند استيراد ملف CSV
في بعض الحالات، قد لا يكون صف الرأس هو الصف الأول في ملف CSV.
على سبيل المثال، خذ بعين الاعتبار ملف CSV التالي الذي يظهر فيه صف الرأس بالفعل في الصف الثاني:
random,data,values
playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22
لقراءة ملف CSV هذا في pandas DataFrame، يمكننا تحديد header=1 كما يلي:
#import from CSV file and specify that header starts on second row df = pd. read_csv ('data.csv', header= 1 ) #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
مثال 4: تخطي الصفوف عند استيراد ملف CSV
يمكنك أيضًا تخطي الصفوف بسهولة عند استيراد ملف CSV باستخدام وسيطة Skirows .
على سبيل المثال، يوضح التعليمة البرمجية التالية كيفية تجاهل السطر الثاني عند استيراد ملف CSV:
#import from CSV file and skip second row df = pd. read_csv ('data.csv', skiprows=[ 1 ] ) #view DataFrame df playerID team points 0 2 Mavs 19 1 3 Bucks 24 2 4 Spurs 22
ويوضح التعليمة البرمجية التالية كيفية تجاهل السطرين الثاني والثالث عند استيراد ملف CSV:
#import from CSV file and skip second and third rows df = pd. read_csv ('data.csv', skiprows=[ 1,2 ] ) #view DataFrame df playerID team points 1 3 Bucks 24 2 4 Spurs 22
مثال 5: قراءة ملفات CSV باستخدام محدد مخصص
في بعض الأحيان قد يكون لديك ملف CSV بمحدد غير الفاصلة.
على سبيل المثال، لنفترض أن ملف CSV الخاص بنا يحتوي على شرطة سفلية كمحدد:
playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22
لقراءة ملف CSV هذا إلى الباندا، يمكننا استخدام الوسيطة sep لتحديد المحدد الذي سيتم استخدامه عند قراءة الملف:
#import from CSV file and specify delimiter to use df = pd. read_csv ('data.csv', sep=' _ ') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ مهام الباندا الشائعة الأخرى:
كيفية قراءة ملف نصي مع الباندا
كيفية قراءة ملفات Excel مع Pandas
كيفية قراءة ملفات TSV مع Pandas
كيفية قراءة جداول HTML مع Pandas