كيفية قراءة ملف tsv باستخدام pandas (بما في ذلك الأمثلة)
لقراءة ملف TSV مع الباندا في بايثون، يمكنك استخدام بناء الجملة الأساسي التالي:
df = pd. read_csv (" data.txt ", sep=" \t ")
يقدم هذا البرنامج التعليمي عدة أمثلة للاستخدام العملي لهذه الوظيفة.
قراءة ملف TSV برأس
لنفترض أن لدينا ملف TSV التالي المسمى data.txt برأس:
لقراءة هذا الملف في pandas DataFrame، يمكننا استخدام الصيغة التالية:
import pandas as pd #read TSV file into pandas DataFrame df = pd. read_csv (" data.txt ", sep=" \t ") #view DataFrame print (df) column1 column2 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 5 7 7 8 8 8 3 1 9 4 9
يمكننا طباعة فئة DataFrame والعثور على عدد الصفوف والأعمدة باستخدام بناء الجملة التالي:
#display class of DataFrame print (type(df)) <class 'pandas.core.frame.DataFrame'> #display number of rows and columns in DataFrame df. shape (10, 2)
يمكننا أن نرى أن df عبارة عن DataFrame الباندا مع 10 صفوف وعمودين.
قراءة ملف TSV بدون رأس
لنفترض أن لدينا ملف TSV التالي المسمى data.txt بدون رأس:
لقراءة هذا الملف في pandas DataFrame، يمكننا استخدام الصيغة التالية:
#read TSV file into pandas DataFrame df = pd. read_csv (" data.txt ", sep=" \t ", header= None ) #view DataFrame print (df) 0 1 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 5 7 7 8 8 8 3 1 9 4 9
نظرًا لعدم وجود رأس للملف النصي، قامت الباندا ببساطة بتسمية العمودين 0 و 1 .
اقرأ ملف TSV بدون رأس وحدد أسماء الأعمدة
إذا أردنا، يمكننا تعيين أسماء الأعمدة عند استيراد الملف النصي باستخدام وسيطة الأسماء :
#read TSV file into pandas DataFrame and specify column names df = pd. read_csv (" data.txt ", sep=" \t ", header= None, names=[" A ", " B "] ) #display DataFrame print (df) A B 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 5 7 7 8 8 8 3 1 9 4 9
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية قراءة أنواع الملفات الأخرى باستخدام الباندا:
كيفية قراءة ملف نصي مع الباندا
كيفية قراءة ملفات CSV مع Pandas
كيفية قراءة ملفات Excel مع Pandas
كيفية قراءة ملف JSON مع Pandas