Pandas dataframe 列を文字列に変換する方法


多くの場合、pandas DataFrame の 1 つ以上の列を文字列に変換したい場合があります。幸いなことに、これは pandas の組み込みastype(str)関数を使用して簡単に行うことができます。

このチュートリアルでは、この関数の使用例をいくつか示します。

例 1: 単一の DataFrame 列を文字列に変換する

次のパンダ データフレームがあるとします。

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E'],
                   'points': [25, 20, 14, 16, 27],
                   'assists': [5, 7, 7, 8, 11]})

#view DataFrame 
df

        player points assists
0 to 25 5
1 B 20 7
2 C 14 7
3 D 16 8
4 E 27 11

dtypes を使用して各列のデータ型を識別できます。

 df. dtypes

player object
int64 dots
assists int64
dtype:object

「プレーヤー」列は文字列であり、他の 2 つの列「ポイント」と「パス」は整数であることがわかります。

次のようにastype(str)を使用するだけで、「points」列を文字列に変換できます。

 df['points'] = df['points'].astype( str )

再度 dtypes を使用して、この列が文字列になっていることを確認できます。

 df. dtypes

player object
points object
assists int64
dtype:object

例 2: 複数の DataFrame 列を文字列に変換する

次の構文を使用して、「points」列と「assists」列の両方を文字列に変換できます。

 df[['points', 'assists']] = df[['points', 'assists']].astype( str )

もう一度、 dtypes を使用して、これらが文字列であることを確認できます。

 df. dtypes

player object
points object
assists object
dtype:object

例 3: データフレーム全体を文字列に変換する

最後に、次の構文を使用して DataFrame の各列を文字列に変換できます。

 #convert every column to strings
df = df.astype(str)

#check data type of each column
df. dtypes
player object
points object
assists object
dtype:object

astype() 関数の完全なドキュメントはここで見つけることができます。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です