الباندا: كيفية إعادة تشكيل dataframe من العرض إلى الطول
يمكنك استخدام بناء الجملة الأساسي التالي لتحويل Pandas DataFrame من تنسيق واسع إلى تنسيق طويل:
df = pd. melt (df, id_vars=' col1 ', value_vars=[' col2 ', ' col3 ', ...])
في هذا السيناريو، col1 هو العمود الذي نستخدمه كمعرف و col2 و col3 وما إلى ذلك. هي الأعمدة التي نتراجع عن محورها.
يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.
مثال: إعادة تشكيل إطار بيانات Pandas من العرض إلى الطول
لنفترض أن لدينا DataFrame الباندا التالية:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D'], ' points ': [88, 91, 99, 94], ' assists ': [12, 17, 24, 28], ' rebounds ': [22, 28, 30, 31]}) #view DataFrame df team points assists rebounds 0 A 88 12 22 1 B 91 17 28 2 C 99 24 30 3 D 94 28 31
يمكننا استخدام بناء الجملة التالي لإعادة تشكيل DataFrame من تنسيق واسع إلى تنسيق طويل:
#reshape DataFrame from wide format to long format
df = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '])
#view updated DataFrame
df
team variable value
0 A points 88
1 B points 91
2 C dots 9 9
3 D dots 94
4 A assists 12
5 B assists 17
6 C assists 24
7 D assists 28
8 A rebounds 22
9 B rebounds 28
10 C rebounds 30
11 D rebounds 31
أصبح DataFrame الآن بتنسيق طويل.
استخدمنا عمود “الفريق” كعمود تعريف وقمنا بإلغاء تحديد أعمدة “النقاط” و”التمريرات الحاسمة” و”المرتدات”.
لاحظ أنه يمكننا أيضًا استخدام الوسيطتين var_name و value_name لتحديد أسماء الأعمدة في DataFrame الطويل الجديد:
#reshape DataFrame from wide format to long format
df = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '],
var_name=' metric ', value_name=' amount ')
#view updated DataFrame
df
team metric amount
0 A points 88
1 B points 91
2 C points 99
3 D dots 94
4 A assists 12
5 B assists 17
6 C assists 24
7 D assists 28
8 A rebounds 22
9 B rebounds 28
10 C rebounds 30
11 D rebounds 31
ملحوظة : يمكنك العثور على التوثيق الكامل لوظيفة pandas Melt() هنا .
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في بايثون:
كيفية إضافة صفوف إلى Pandas DataFrame
كيفية إضافة أعمدة إلى Pandas DataFrame
كيفية حساب تكرارات قيم محددة في Pandas DataFrame