الباندا: كيفية قراءة ملف excel مع الخلايا المدمجة
عندما تقرأ ملف Excel يحتوي على خلايا مدمجة في pandas DataFrame، سيتم ملء الخلايا المدمجة تلقائيًا بقيم NaN.
أسهل طريقة لملء قيم NaN هذه بعد استيراد الملف هي استخدام وظيفة pandas fillna() كما يلي:
df = df. fillna (method=' ffill ', axis= 0 )
يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.
مثال: قراءة ملف Excel يحتوي على خلايا مدمجة في Pandas
لنفترض أن لدينا ملف Excel التالي المسمى merged_data.xlsx والذي يحتوي على معلومات حول العديد من لاعبي كرة السلة:
لاحظ أنه تم دمج القيم الموجودة في عمود الفريق .
ينتمي اللاعبون من A إلى D إلى Mavericks بينما ينتمي اللاعبون من E إلى H إلى Rockets.
لنفترض أننا نستخدم الدالة read_excel() لقراءة ملف Excel هذا في إطار بيانات الباندا:
import pandas as pd #import Excel fie df = pd. read_excel (' merged_data.xlsx ' ) #view DataFrame print (df) Team Player Points Assists 0 Mavericks A 22 4 1 NaN B 29 4 2 NaN C 45 3 3 NaN D 30 7 4 Rockets E 29 8 5 NaN F 16 6 6 NaN G 25 9 7 NaN H 20 12
بشكل افتراضي، تقوم الباندا بتعبئة الخلايا المدمجة بقيم NaN.
لملء كل من قيم NaN هذه بأسماء الفريق، يمكننا استخدام الدالة fillna() كما يلي:
#fill in NaN values with team names df = df. fillna (method=' ffill ', axis= 0 ) #view updated DataFrame print (df) Team Player Points Assists 0 Mavericks A 22 4 1 Mavericks B 29 4 2 Mavericks C 45 3 3 Mavericks D 30 7 4 Rockets E 29 8 5 Rockets F 16 6 6 Rockets G 25 9 7 Rockets M 20 12
لاحظ أنه تمت تعبئة كل قيمة من قيم NaN باسم الفريق المناسب.
لاحظ أن الوسيطة axis=0 تخبر الباندا بملء قيم NaN رأسيًا.
لملء قيم NaN أفقيًا في الأعمدة، يمكنك تحديد المحور=1 .
ملاحظة : يمكنك العثور على الوثائق الكاملة لوظيفة pandas fillna() هنا .
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في الباندا:
الباندا: كيفية تخطي الأسطر عند قراءة ملف Excel
الباندا: كيفية تحديد الأنواع عند استيراد ملف Excel
الباندا: كيفية الجمع بين أوراق إكسل متعددة