كيفية قراءة ملف tsv باستخدام pandas (بما في ذلك الأمثلة)


لقراءة ملف TSV مع الباندا في بايثون، يمكنك استخدام بناء الجملة الأساسي التالي:

 df = pd. read_csv (" data.txt ", sep=" \t ")

يقدم هذا البرنامج التعليمي عدة أمثلة للاستخدام العملي لهذه الوظيفة.

قراءة ملف TSV برأس

لنفترض أن لدينا ملف TSV التالي المسمى data.txt برأس:

لقراءة هذا الملف في pandas DataFrame، يمكننا استخدام الصيغة التالية:

 import pandas as pd

#read TSV file into pandas DataFrame
df = pd. read_csv (" data.txt ", sep=" \t ")

#view DataFrame
print (df)

	column1 column2
0 1 4
1 3 4
2 2 5
3 7 9
4 9 1
5 6 3
6 5 7
7 8 8
8 3 1
9 4 9

يمكننا طباعة فئة DataFrame والعثور على عدد الصفوف والأعمدة باستخدام بناء الجملة التالي:

 #display class of DataFrame
print (type(df))

<class 'pandas.core.frame.DataFrame'>

#display number of rows and columns in DataFrame
df. shape

(10, 2)

يمكننا أن نرى أن df عبارة عن DataFrame الباندا مع 10 صفوف وعمودين.

قراءة ملف TSV بدون رأس

لنفترض أن لدينا ملف TSV التالي المسمى data.txt بدون رأس:

لقراءة هذا الملف في pandas DataFrame، يمكننا استخدام الصيغة التالية:

 #read TSV file into pandas DataFrame
df = pd. read_csv (" data.txt ", sep=" \t ", header= None )

#view DataFrame
print (df)

        0 1
0 1 4
1 3 4
2 2 5
3 7 9
4 9 1
5 6 3
6 5 7
7 8 8
8 3 1
9 4 9

نظرًا لعدم وجود رأس للملف النصي، قامت الباندا ببساطة بتسمية العمودين 0 و 1 .

اقرأ ملف TSV بدون رأس وحدد أسماء الأعمدة

إذا أردنا، يمكننا تعيين أسماء الأعمدة عند استيراد الملف النصي باستخدام وسيطة الأسماء :

 #read TSV file into pandas DataFrame and specify column names
df = pd. read_csv (" data.txt ", sep=" \t ", header= None, names=[" A ", " B "] )

#display DataFrame
print (df)

	A B
0 1 4
1 3 4
2 2 5
3 7 9
4 9 1
5 6 3
6 5 7
7 8 8
8 3 1
9 4 9

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية قراءة أنواع الملفات الأخرى باستخدام الباندا:

كيفية قراءة ملف نصي مع الباندا
كيفية قراءة ملفات CSV مع Pandas
كيفية قراءة ملفات Excel مع Pandas
كيفية قراءة ملف JSON مع Pandas

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *