パンダ: 列から特殊文字を削除する方法


次の基本構文を使用して、pandas DataFrame の列から特殊文字を削除できます。

 df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )

この特定の例では、 my_columnから文字でも数字でもないすべての文字が削除されます。

次の例は、この構文を実際に使用する方法を示しています。

例: Pandas の列から特殊文字を削除する

さまざまなバスケットボール選手に関する情報を含む次のパンダ データフレームがあるとします。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs$ 12
1 Nets 15
2 Kings!! 22
3 Spurs% 29
4 &Heat& 24

チーム列の値からすべての特殊文字を削除するとします。

これを行うには、次の構文を使用できます。

 #remove special characters from team column
df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Spurs 29
4 Heat 24

すべての特殊文字がチーム列の値から削除されていることに注意してください。

: 正規表現\W は、すべての非単語文字、つまりアルファベットでも数字でもない文字を検索するために使用されます。

この例では、単語以外の文字を空の値に置き換えました。これは単語以外の文字を削除するのと同じです。

追加リソース

次のチュートリアルでは、パンダで他の一般的なタスクを実行する方法を説明します。

Pandas で NaN 値をゼロに置き換える方法
Pandas で空の文字列を NaN に置き換える方法
Pandasで条件に基づいて列の値を置き換える方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です