الباندا: كيفية تحديد الأنواع عند استيراد ملف excel


يمكنك استخدام بناء الجملة الأساسي التالي لتحديد نوع كل عمود في DataFrame عند استيراد ملف Excel إلى الباندا:

 df = pd. read_excel (' my_data.xlsx ',
                 dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })

تحدد الوسيطة dtype نوع البيانات الذي يجب أن يحتوي عليه كل عمود عند استيراد ملف Excel إلى Pandas DataFrame.

يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.

مثال: تحديد الأنواع عند استيراد ملف Excel إلى Pandas

لنفترض أن لدينا ملف Excel التالي المسمى player_data.xlsx :

إذا قمنا باستيراد ملف Excel باستخدام الدالة read_excel() ، فستحاول الباندا تحديد نوع البيانات تلقائيًا لكل عمود:

 import pandas as pd

#import Excel file
df = pd. read_excel (' player_data.xlsx ')

#view resulting DataFrame
print (df)

  team points rebound assists
0 to 24 8 5
1 B 20 12 3
2 C 15 4 7
3 D 19 4 8
4 E 32 6 8
5 F 13 7 9

#view data type of each column
print ( df.dtypes )

team object
int64 dots
rebounds int64
assists int64
dtype:object

من النتيجة، يمكننا أن نرى أن أعمدة DataFrame تحتوي على أنواع البيانات التالية:

  • الفريق : كائن
  • النقاط : int64
  • الارتدادات : int64
  • المساعدة : int64

ومع ذلك، يمكننا استخدام الوسيطة dtype في الدالة read_excel() لتحديد أنواع البيانات التي يجب أن يحتوي عليها كل عمود:

import pandas as pd

#import Excel file and specify dtypes of columns
df = pd. read_excel (' player_data.xlsx ',
                   dtype = {' team ': str , ' points ': float , ' rebounds ': int ,
                            ' assists ': float })

#view resulting DataFrame
print (df)

  team points rebound assists
0 A 24.0 8 5.0
1 B 20.0 12 3.0
2 C 15.0 4 7.0
3 D 19.0 4 8.0
4 E 32.0 6 8.0
5 F 13.0 7 9.0

#view data type of each column
print ( df.dtypes )

team object
float64 points
rebounds int32
assist float64
dtype:object

من النتيجة، يمكننا أن نرى أن أعمدة DataFrame تحتوي على أنواع البيانات التالية:

  • الفريق : كائن
  • النقاط : float64
  • الارتدادات : int32
  • التمريرات الحاسمة : float64

تتوافق أنواع البيانات هذه مع تلك التي حددناها باستخدام وسيطة dtype .

لاحظ أننا في هذا المثال قمنا بتحديد نوع كل عمود في DataFrame.

ومع ذلك، يمكنك اختيار تحديد نوع أعمدة معينة فقط والسماح لحيوانات الباندا باستنتاج نوع الأعمدة المتبقية.

ملاحظة : يمكنك العثور على الوثائق الكاملة لوظيفة Pandas read_excel() هنا .

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في الباندا:

الباندا: كيفية تخطي الأسطر عند قراءة ملف Excel
الباندا: كيفية الجمع بين أوراق إكسل متعددة
الباندا: كيفية كتابة DataFrames عبر أوراق Excel متعددة

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *