الدليل النهائي: كيفية قراءة ملفات csv باستخدام pandas


تعد ملفات CSV (قيمة مفصولة بفواصل) إحدى الطرق الأكثر شيوعًا لتخزين البيانات.

لحسن الحظ، تتيح لك وظيفة Pandas read_csv () قراءة ملفات CSV بسهولة في Python بأي تنسيق تريده تقريبًا.

يشرح هذا البرنامج التعليمي عدة طرق لقراءة ملفات CSV في Python باستخدام ملف CSV التالي المسمى “data.csv” :

 playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22

مثال 1: اقرأ ملف CSV في ملف pandas DataFrame

يوضح التعليمة البرمجية التالية كيفية قراءة ملف CSV في pandas DataFrame:

 #import CSV file as DataFrame
df = pd. read_csv ('data.csv')

#view DataFrame
df

        playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

مثال 2: قراءة أعمدة محددة من ملف CSV

يوضح التعليمة البرمجية التالية كيفية قراءة الأعمدة المسماة “playerID” و”النقاط” من ملف CSV فقط في pandas DataFrame:

 #import only specific columns from CSV file
df = pd. read_csv ('data.csv', usecols=[' playerID ',' points '])

#view DataFrame
df

	playerID points
0 1 26
1 2 19
2 3 24
3 4 22

يمكنك أيضًا تحديد فهارس الأعمدة لقراءتها في Pandas DataFrame:

 #import only specific columns from CSV file
df = pd. read_csv (' data.csv ', usecols=[ 0,1 ])

#view DataFrame
df

        playerID team
0 1 Lakers
1 2 Mavs
2 3 Bucks
3 4 Spurs

مثال 3: حدد صف الرأس عند استيراد ملف CSV

في بعض الحالات، قد لا يكون صف الرأس هو الصف الأول في ملف CSV.

على سبيل المثال، خذ بعين الاعتبار ملف CSV التالي الذي يظهر فيه صف الرأس بالفعل في الصف الثاني:

 random,data,values
playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22

لقراءة ملف CSV هذا في pandas DataFrame، يمكننا تحديد header=1 كما يلي:

 #import from CSV file and specify that header starts on second row
df = pd. read_csv ('data.csv', header= 1 )

#view DataFrame
df

        playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

مثال 4: تخطي الصفوف عند استيراد ملف CSV

يمكنك أيضًا تخطي الصفوف بسهولة عند استيراد ملف CSV باستخدام وسيطة Skirows .

على سبيل المثال، يوضح التعليمة البرمجية التالية كيفية تجاهل السطر الثاني عند استيراد ملف CSV:

 #import from CSV file and skip second row
df = pd. read_csv ('data.csv', skiprows=[ 1 ] )

#view DataFrame
df

        playerID team points
0 2 Mavs 19
1 3 Bucks 24
2 4 Spurs 22

ويوضح التعليمة البرمجية التالية كيفية تجاهل السطرين الثاني والثالث عند استيراد ملف CSV:

 #import from CSV file and skip second and third rows
df = pd. read_csv ('data.csv', skiprows=[ 1,2 ] )

#view DataFrame
df

        playerID team points
1 3 Bucks 24
2 4 Spurs 22

مثال 5: قراءة ملفات CSV باستخدام محدد مخصص

في بعض الأحيان قد يكون لديك ملف CSV بمحدد غير الفاصلة.

على سبيل المثال، لنفترض أن ملف CSV الخاص بنا يحتوي على شرطة سفلية كمحدد:

 playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22

لقراءة ملف CSV هذا إلى الباندا، يمكننا استخدام الوسيطة sep لتحديد المحدد الذي سيتم استخدامه عند قراءة الملف:

 #import from CSV file and specify delimiter to use
df = pd. read_csv ('data.csv', sep=' _ ')

#view DataFrame
df

	playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ مهام الباندا الشائعة الأخرى:

كيفية قراءة ملف نصي مع الباندا
كيفية قراءة ملفات Excel مع Pandas
كيفية قراءة ملفات TSV مع Pandas
كيفية قراءة جداول HTML مع Pandas

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *