كيفية حساب التكرارات في الباندا: مع الأمثلة


يمكنك استخدام الطرق التالية لحساب التكرارات في Pandas DataFrame:

الطريقة الأولى: حساب القيم المكررة في عمود

 len (df[' my_column ']) - len (df[' my_column ']. drop_duplicates ())

الطريقة الثانية: حساب الصفوف المكررة

 len (df) -len ( df.drop_duplicates ())

الطريقة الثالثة: حساب التكرارات لكل صف فريد

 df. groupby ( df.columns.tolist (), as_index= False ) . size ()

توضح الأمثلة التالية كيفية استخدام كل طريقة عمليًا مع الباندا DataFrame التالية:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'],
                   ' points ': [5, 5, 8, 10, 5, 7, 10, 10]})

#view DataFrame
print (df)

  team position points
0 AG 5
1 GA 5
2 AG 8
3 AF 10
4 BG 5
5 BG 7
6 BF 10
7 BF 10

مثال 1: حساب القيم المكررة في عمود

الكود التالي يوضح كيفية حساب عدد القيم المكررة في عمود النقاط :

 #count duplicate values in points column
len (df[' points '])- len (df[' points ']. drop_duplicates ())

4

يمكننا أن نرى أن هناك 4 قيم مكررة في عمود النقاط .

المثال 2: حساب الصفوف المكررة

يوضح التعليمة البرمجية التالية كيفية حساب عدد الصفوف المكررة في DataFrame:

 #count number of duplicate rows
len (df) -len ( df.drop_duplicates ())

2

يمكننا أن نرى أن هناك صفين مكررين في DataFrame.

يمكننا استخدام بناء الجملة التالي لعرض هذين الخطين المكررين:

 #display duplicated rows
df[df. duplicated ()]

        team position points
1 A G 5
7 B F 10

مثال 3: حساب التكرارات لكل صف فريد

يوضح التعليمة البرمجية التالية كيفية حساب عدد التكرارات لكل صف فريد في DataFrame:

 #display number of duplicates for each unique row
df. groupby ( df.columns.tolist (), as_index= False ) . size ()

        team position points size
0 A F 10 1
1 A G 5 2
2 A G 8 1
3 B F 10 2
4 B G 5 1
5 B G 7 1

يعرض عمود الحجم عدد التكرارات لكل صف فريد.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في الباندا:

كيفية إزالة الصفوف المكررة في الباندا
كيفية إزالة الأعمدة المكررة في الباندا
كيفية تحديد الأعمدة حسب الفهرس في Pandas

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *