الباندا: كيفية إزالة الأحرف الخاصة من العمود
يمكنك استخدام بناء الجملة الأساسي التالي لإزالة الأحرف الخاصة من عمود في pandas DataFrame:
df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )
سيؤدي هذا المثال تحديدًا إلى إزالة جميع الأحرف من my_column التي ليست أحرفًا ولا أرقامًا.
يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.
مثال: إزالة الأحرف الخاصة من العمود في Pandas
لنفترض أن لدينا DataFrame الباندا التالية التي تحتوي على معلومات حول مختلف لاعبي كرة السلة:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'], ' points ': [12, 15, 22, 29, 24]}) #view DataFrame print (df) team points 0 Mavs$ 12 1 Nets 15 2 Kings!! 22 3 Spurs% 29 4 &Heat& 24
لنفترض أننا نريد إزالة كافة الأحرف الخاصة من قيم عمود الفريق .
يمكننا استخدام بناء الجملة التالي للقيام بذلك:
#remove special characters from team column df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True ) #view updated DataFrame print (df) team points 0 Mavs 12 1 Nets 15 2 Kings 22 3 Spurs 29 4 Heat 24
لاحظ أنه تمت إزالة كافة الأحرف الخاصة من قيم عمود الفريق .
ملاحظة : يتم استخدام التعبير العادي \W للبحث عن كافة الأحرف غير الكلمة، أي الأحرف التي ليست أبجدية ولا رقمية.
في هذا المثال، قمنا باستبدال كل حرف غير كلمة بقيمة فارغة، وهو ما يعادل إزالة الأحرف غير الكلمة.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في الباندا:
كيفية استبدال قيم NaN بالأصفار في Pandas
كيفية استبدال السلاسل الفارغة بـ NaN في Pandas
كيفية استبدال القيم في العمود بناءً على الحالة في Pandas