パンダ: 文字列から特定の文字を削除する方法


次のメソッドを使用して、pandas DataFrame の列の文字列から特定の文字を削除できます。

方法 1: 文字列から特定の文字を削除する

 df[' my_column '] = df[' my_column ']. str . replace (' this_string ', '')

方法 2: 文字列からすべての文字を削除する

 df[' my_column '] = df[' my_column ']. str . replace (' \D ', '', regex= True )

方法 3: 文字列からすべての数値を削除する

 df[' my_column '] = df[' my_column ']. str . replace (' \d+ ', '', regex= True )

次の例は、次の pandas DataFrame で各メソッドを実際に使用する方法を示しています。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs2', 'Nets44', 'Kings33', 'Cavs90', 'Heat576'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs2 12
1 Nets44 15
2 Kings33 22
3 Cavs90 29
4 Heat576 24

例 1: 文字列から特定の文字を削除する

次の構文を使用して、チーム列の各文字列から「avs」を削除できます。

 #remove 'avs' from strings in team column
df[' team '] = df[' team ']. str . replace (' avs ', '')

#view updated DataFrame
print (df)

      team points
0 M2 12
1 Nets44 15
2 Kings33 22
3 C90 29
4 Heat576 24

チーム列の「Mavs」と「Cavs」を含む行から「avs」が削除されていることに注意してください。

例 2: 文字列からすべての文字を削除する

次の構文を使用して、チーム列の各文字列からすべての文字を削除できます。

 #remove letters from strings in team column
df[' team '] = df[' team ']. str . replace (' \D ', '', regex= True )

#view updated DataFrame
print (df)

  team points
0 2 12
1 44 15
2 33 22
3 90 29
4,576 24

チーム列の各文字列からすべての文字が削除されていることに注意してください。

数値だけが残ります。

例 3: 文字列からすべての数値を削除する

次の構文を使用して、チーム列の各文字列からすべての数値を削除できます。

 #remove numbers from strings in team column
df[' team '] = df[' team ']. str . replace (' \d+ ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Cavs 29
4 Heat 24

チーム列の各文字列からすべての数字が削除されていることに注意してください。

文字だけが残ります。

追加リソース

次のチュートリアルでは、パンダで他の一般的なタスクを実行する方法を説明します。

Pandas で NaN 値をゼロに置き換える方法
Pandas で空の文字列を NaN に置き換える方法
Pandasで条件に基づいて列の値を置き換える方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です