الباندا: كيفية إزالة الأحرف الخاصة من العمود


يمكنك استخدام بناء الجملة الأساسي التالي لإزالة الأحرف الخاصة من عمود في pandas DataFrame:

 df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )

سيؤدي هذا المثال تحديدًا إلى إزالة جميع الأحرف من my_column التي ليست أحرفًا ولا أرقامًا.

يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.

مثال: إزالة الأحرف الخاصة من العمود في Pandas

لنفترض أن لدينا DataFrame الباندا التالية التي تحتوي على معلومات حول مختلف لاعبي كرة السلة:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs$ 12
1 Nets 15
2 Kings!! 22
3 Spurs% 29
4 &Heat& 24

لنفترض أننا نريد إزالة كافة الأحرف الخاصة من قيم عمود الفريق .

يمكننا استخدام بناء الجملة التالي للقيام بذلك:

 #remove special characters from team column
df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Spurs 29
4 Heat 24

لاحظ أنه تمت إزالة كافة الأحرف الخاصة من قيم عمود الفريق .

ملاحظة : يتم استخدام التعبير العادي \W للبحث عن كافة الأحرف غير الكلمة، أي الأحرف التي ليست أبجدية ولا رقمية.

في هذا المثال، قمنا باستبدال كل حرف غير كلمة بقيمة فارغة، وهو ما يعادل إزالة الأحرف غير الكلمة.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في الباندا:

كيفية استبدال قيم NaN بالأصفار في Pandas
كيفية استبدال السلاسل الفارغة بـ NaN في Pandas
كيفية استبدال القيم في العمود بناءً على الحالة في Pandas

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *