الباندا: كيفية دمج الأعمدة التي تحمل نفس الاسم
يمكنك استخدام بناء الجملة الأساسي التالي لدمج الأعمدة في pandas DataFrame التي تشترك في نفس اسم العمود:
#define function to merge columns with same names together def same_merge (x): return ' , '. join (x[ x.notnull ()]. astype (str)) #define new DataFrame that merges columns with same names together df_new = df. groupby (level= 0 , axis= 1 ). apply ( lambda x: x.apply (same_merge,axis= 1 ))
يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.
مثال: دمج الأعمدة التي تشترك في نفس الاسم في Pandas
لنفترض أن لدينا DataFrame الباندا التالية:
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({' A ': [5, 6, 8, np.nan, 4, np.nan, np.nan], ' A1 ': [np.nan, 12, np.nan, 10, np.nan, 6, 4], ' B ': [2, 7, np.nan, np.nan, 2, 4, np.nan], ' B1 ': [5, np.nan, 6, 15, 1, np.nan, 4]}) #rename columns so there are duplicate column names df. columns = [' A ', ' A ', ' B ', ' B '] #view DataFrame print (df) AABB 0 5.0 NaN 2.0 5.0 1 6.0 12.0 7.0 NaN 2 8.0 NaN NaN 6.0 3 NaN 10.0 NaN 15.0 4 4.0 NaN 2.0 1.0 5 NaN 6.0 4.0 NaN 6 NaN 4.0 NaN 4.0
لاحظ أن هناك عمودين يحملان اسم “A” وعمودين يحملان اسم “B.”
يمكننا استخدام الكود التالي لدمج الأعمدة التي لها نفس أسماء الأعمدة وربط قيمها بفاصلة:
#define function to merge columns with same names together def same_merge (x): return ' , '. join (x[ x.notnull ()]. astype (str)) #define new DataFrame that merges columns with same names together df_new = df. groupby (level= 0 , axis= 1 ). apply ( lambda x: x.apply (same_merge,axis= 1 )) #view new DataFrame print (df_new) AB 0 5.0 2.0,5.0 1 6.0,12.0 7.0 2 8.0 6.0 3 10.0 15.0 4 4.0 2.0,1.0 5 6.0 4.0 6 4.0 4.0
قام DataFrame الجديد بدمج الأعمدة التي تحمل نفس الأسماء وربط قيمها بفاصلة.
إذا كنت تريد استخدام فاصل مختلف، فما عليك سوى استبدال فاصل الفاصلة بشيء آخر في الدالة Same_merge() .
على سبيل المثال، يوضح التعليمة البرمجية التالية كيفية استخدام فاصل منقوطة بدلاً من ذلك:
#define function to merge columns with same names together def same_merge (x): return ' ; '. join (x[ x.notnull ()]. astype (str)) #define new DataFrame that merges columns with same names together df_new = df. groupby (level= 0 , axis= 1 ). apply ( lambda x: x.apply (same_merge,axis= 1 )) #view new DataFrame print (df_new) AB 0 5.0 2.0;5.0 1 6.0;12.0 7.0 2 8.0 6.0 3 10.0 15.0 4 4.0 2.0;1.0 5 6.0 4.0 6 4.0 4.0
قام DataFrame الجديد بدمج الأعمدة التي تحمل نفس الأسماء وربط قيمها بفاصلة منقوطة.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في الباندا:
كيفية إزالة الأعمدة المكررة في الباندا
كيفية سرد كافة أسماء الأعمدة في الباندا
كيفية فرز الأعمدة حسب الاسم في الباندا