Pandas dataframe 列を文字列に変換する方法
多くの場合、pandas DataFrame の 1 つ以上の列を文字列に変換したい場合があります。幸いなことに、これは pandas の組み込みastype(str)関数を使用して簡単に行うことができます。
このチュートリアルでは、この関数の使用例をいくつか示します。
例 1: 単一の DataFrame 列を文字列に変換する
次のパンダ データフレームがあるとします。
import pandas as pd #createDataFrame df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E'], 'points': [25, 20, 14, 16, 27], 'assists': [5, 7, 7, 8, 11]}) #view DataFrame df player points assists 0 to 25 5 1 B 20 7 2 C 14 7 3 D 16 8 4 E 27 11
dtypes を使用して各列のデータ型を識別できます。
df. dtypes
player object
int64 dots
assists int64
dtype:object
「プレーヤー」列は文字列であり、他の 2 つの列「ポイント」と「パス」は整数であることがわかります。
次のようにastype(str)を使用するだけで、「points」列を文字列に変換できます。
df['points'] = df['points'].astype( str )
再度 dtypes を使用して、この列が文字列になっていることを確認できます。
df. dtypes
player object
points object
assists int64
dtype:object
例 2: 複数の DataFrame 列を文字列に変換する
次の構文を使用して、「points」列と「assists」列の両方を文字列に変換できます。
df[['points', 'assists']] = df[['points', 'assists']].astype( str )
もう一度、 dtypes を使用して、これらが文字列であることを確認できます。
df. dtypes
player object
points object
assists object
dtype:object
例 3: データフレーム全体を文字列に変換する
最後に、次の構文を使用して DataFrame の各列を文字列に変換できます。
#convert every column to strings df = df.astype(str) #check data type of each column df. dtypes player object points object assists object dtype:object
astype() 関数の完全なドキュメントはここで見つけることができます。