Pandas の文字列に先頭のゼロを追加する方法


次の構文を使用して、pandas DataFrame の文字列に先頭のゼロを追加できます。

 df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )

この特定の数式は、各文字列の長さが7になるまで、「ID」というラベルの付いた列の文字列に必要なだけ先頭のゼロを追加します。

自由に7を別の値に置き換えて、異なる数の先行ゼロを追加してください。

次の例は、この構文を実際に使用する方法を示しています。

例: Pandas の文字列に先頭のゼロを追加する

さまざまなストアからの販売と払い戻しに関する情報を含む次のパンダ データフレームがあるとします。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' ID ': ['A25', 'B300', 'C6', 'D447289', 'E416', 'F19'],
                   ' sales ': [18, 12, 27, 30, 45, 23],
                   ' refunds ': [1, 3, 3, 2, 5, 0]})

#view DataFrame
print (df)

        ID sales refunds
0 A25 18 1
1 B300 12 3
2 C6 27 3
3 D447289 30 2
4 E416 45 5
5 F19 23 0

「ID」列の文字列の長さはすべて同じではないことに注意してください。

ただし、最長の文字列は7文字であることがわかります。

次の構文を使用して、「ID」列の文字列に先頭のゼロを追加して、各文字列の長さが7になるようにします。

 #add leading zeros to 'ID' column
df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )

#view updated DataFrame
print (df)

        ID sales refunds
0 0000A25 18 1
1 000B300 12 3
2 00000C6 27 3
3 D447289 30 2
4 000E416 45 5
5 0000F19 23 0

各文字列の長さが同じになるように、「ID」列の文字列に先頭のゼロが追加されていることに注意してください。

: pandas のapply関数の完全なドキュメントはここで見つけることができます。

追加リソース

次のチュートリアルでは、パンダで他の一般的なタスクを実行する方法を説明します。

パンダで欠損値を代入する方法
パンダで欠損値を数える方法
パンダでNaN値を平均値で埋める方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です