الباندا: كيفية إزالة التكرارات على أعمدة متعددة


يمكنك استخدام الطرق التالية لإزالة الصفوف المكررة عبر أعمدة متعددة في pandas DataFrame:

الطريقة الأولى: إزالة التكرارات في كافة الأعمدة

 df. drop_duplicates ()

الطريقة الثانية: إزالة التكرارات في أعمدة محددة

 df. drop_duplicates ([' column1 ',' column3 '])

توضح الأمثلة التالية كيفية استخدام كل طريقة عمليًا مع الباندا DataFrame التالية:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' region ': ['East', 'East', 'East', 'West', 'West', 'West'],
                   ' store ': [1, 1, 2, 1, 2, 2],
                   ' sales ': [5, 5, 7, 9, 12, 8]})

#view DataFrame
print (df)

  region store sales
0 East 1 5
1 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8

مثال 1: إزالة التكرارات في كافة الأعمدة

يوضح الكود التالي كيفية إزالة الصفوف ذات القيم المكررة في جميع الأعمدة:

 #drop rows that have duplicate values across all columns
df. drop_duplicates ()

	region store sales
0 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8

يحتوي الصف الموجود في موضع الفهرس 1 على نفس القيم في جميع الأعمدة مثل الصف الموجود في موضع الفهرس 0، لذلك تمت إزالته من DataFrame.

افتراضيًا، تحتفظ الباندا بالسطر الأول كنسخة مكررة. ومع ذلك، يمكنك استخدام الوسيطة keep لتحديد الاحتفاظ بالسطر المكرر الأخير:

 #drop rows that have duplicate values across all columns (keep last duplicate)
df. drop_duplicates (keep=' last ')

	region store sales
1 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8

المثال 2: إزالة التكرارات في أعمدة محددة

يمكنك استخدام الكود التالي لإزالة الصفوف ذات القيم المكررة فقط في المنطقة وأعمدة المتجر :

 #drop rows that have duplicate values across region and store columns
df. drop_duplicates ([' region ',' store '])

	region store sales
0 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12

في المجمل، تمت إزالة صفين من DataFrame لأنهما يحتويان على قيم مكررة في أعمدة المنطقة والمتجر .

ملاحظة : يمكنك العثور على الوثائق الكاملة لوظيفة drop_duplicates() هنا .

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في الباندا:

كيفية العثور على التكرارات في الباندا
كيفية إزالة الأعمدة المكررة في الباندا
كيفية إزالة الصف الأول في Pandas DataFrame

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *