الباندا: كيفية تحديد الأنواع عند استيراد ملف excel
يمكنك استخدام بناء الجملة الأساسي التالي لتحديد نوع كل عمود في DataFrame عند استيراد ملف Excel إلى الباندا:
df = pd. read_excel (' my_data.xlsx ', dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })
تحدد الوسيطة dtype نوع البيانات الذي يجب أن يحتوي عليه كل عمود عند استيراد ملف Excel إلى Pandas DataFrame.
يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.
مثال: تحديد الأنواع عند استيراد ملف Excel إلى Pandas
لنفترض أن لدينا ملف Excel التالي المسمى player_data.xlsx :
إذا قمنا باستيراد ملف Excel باستخدام الدالة read_excel() ، فستحاول الباندا تحديد نوع البيانات تلقائيًا لكل عمود:
import pandas as pd #import Excel file df = pd. read_excel (' player_data.xlsx ') #view resulting DataFrame print (df) team points rebound assists 0 to 24 8 5 1 B 20 12 3 2 C 15 4 7 3 D 19 4 8 4 E 32 6 8 5 F 13 7 9 #view data type of each column print ( df.dtypes ) team object int64 dots rebounds int64 assists int64 dtype:object
من النتيجة، يمكننا أن نرى أن أعمدة DataFrame تحتوي على أنواع البيانات التالية:
- الفريق : كائن
- النقاط : int64
- الارتدادات : int64
- المساعدة : int64
ومع ذلك، يمكننا استخدام الوسيطة dtype في الدالة read_excel() لتحديد أنواع البيانات التي يجب أن يحتوي عليها كل عمود:
import pandas as pd #import Excel file and specify dtypes of columns df = pd. read_excel (' player_data.xlsx ', dtype = {' team ': str , ' points ': float , ' rebounds ': int , ' assists ': float }) #view resulting DataFrame print (df) team points rebound assists 0 A 24.0 8 5.0 1 B 20.0 12 3.0 2 C 15.0 4 7.0 3 D 19.0 4 8.0 4 E 32.0 6 8.0 5 F 13.0 7 9.0 #view data type of each column print ( df.dtypes ) team object float64 points rebounds int32 assist float64 dtype:object
من النتيجة، يمكننا أن نرى أن أعمدة DataFrame تحتوي على أنواع البيانات التالية:
- الفريق : كائن
- النقاط : float64
- الارتدادات : int32
- التمريرات الحاسمة : float64
تتوافق أنواع البيانات هذه مع تلك التي حددناها باستخدام وسيطة dtype .
لاحظ أننا في هذا المثال قمنا بتحديد نوع كل عمود في DataFrame.
ومع ذلك، يمكنك اختيار تحديد نوع أعمدة معينة فقط والسماح لحيوانات الباندا باستنتاج نوع الأعمدة المتبقية.
ملاحظة : يمكنك العثور على الوثائق الكاملة لوظيفة Pandas read_excel() هنا .
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في الباندا:
الباندا: كيفية تخطي الأسطر عند قراءة ملف Excel
الباندا: كيفية الجمع بين أوراق إكسل متعددة
الباندا: كيفية كتابة DataFrames عبر أوراق Excel متعددة