文字列から pandas dataframe を作成する方法
次の基本構文を使用して、文字列から pandas DataFrame を作成できます。
import pandas as pd import io df = pd. read_csv ( io.StringIO (string_data), sep=" , ")
この特定の構文は、 string_dataという文字列に含まれる値を使用して pandas DataFrame を作成します。
次の例は、この構文を実際に使用する方法を示しています。
例 1: カンマ区切りを使用した文字列からデータフレームを作成する
次のコードは、文字列値がカンマで区切られた文字列から pandas DataFrame を作成する方法を示しています。
import pandas as pd import io #define string string_data="""points, assists, rebounds 5, 15, 22 7, 12, 9 4, 3, 18 2, 5, 10 3, 11, 5 """ #create pandas DataFrame from string df = pd. read_csv ( io.StringIO (string_data), sep=" , ") #view DataFrame print (df) points assists rebounds 0 5 15 22 1 7 12 9 2 4 3 18 3 2 5 10 4 3 11 5
結果は、5 行 3 列の pandas DataFrame になります。
例 2: セミコロン区切り文字を含む文字列からデータフレームを作成する
次のコードは、文字列値がセミコロンで区切られた文字列から pandas DataFrame を作成する方法を示しています。
import pandas as pd import io #define string string_data="""points;assists;rebounds 5;15;22 7;12;9 4;3;18 2;5;10 3;11;5 """ #create pandas DataFrame from string df = pd. read_csv ( io.StringIO (string_data), sep=" ; ") #view DataFrame print (df) points assists rebounds 0 5 15 22 1 7 12 9 2 4 3 18 3 2 5 10 4 3 11 5
結果は、5 行 3 列の pandas DataFrame になります。
異なる区切り文字を含む文字列がある場合は、 read_csv()関数のsep引数を使用して区切り文字を指定するだけです。
追加リソース
次のチュートリアルでは、パンダで他の一般的なタスクを実行する方法を説明します。
Pandas DataFrame 列を文字列に変換する方法
Pandasでタイムスタンプを日付/時刻に変換する方法
Pandas で DateTime を日付に変換する方法