文字列から pandas dataframe を作成する方法


次の基本構文を使用して、文字列から pandas DataFrame を作成できます。

 import pandas as pd
import io   

df = pd. read_csv ( io.StringIO (string_data), sep=" , ")

この特定の構文は、 string_dataという文字列に含まれる値を使用して pandas DataFrame を作成します。

次の例は、この構文を実際に使用する方法を示しています。

例 1: カンマ区切りを使用した文字列からデータフレームを作成する

次のコードは、文字列値がカンマで区切られた文字列から pandas DataFrame を作成する方法を示しています。

 import pandas as pd
import io

#define string
string_data="""points, assists, rebounds
5, 15, 22
7, 12, 9
4, 3, 18
2, 5, 10
3, 11, 5
"""

#create pandas DataFrame from string
df = pd. read_csv ( io.StringIO (string_data), sep=" , ")

#view DataFrame
print (df)

   points assists rebounds
0 5 15 22
1 7 12 9
2 4 3 18
3 2 5 10
4 3 11 5

結果は、5 行 3 列の pandas DataFrame になります。

例 2: セミコロン区切り文字を含む文字列からデータフレームを作成する

次のコードは、文字列値がセミコロンで区切られた文字列から pandas DataFrame を作成する方法を示しています。

 import pandas as pd
import io

#define string
string_data="""points;assists;rebounds
5;15;22
7;12;9
4;3;18
2;5;10
3;11;5
"""

#create pandas DataFrame from string
df = pd. read_csv ( io.StringIO (string_data), sep=" ; ")

#view DataFrame
print (df)

   points assists rebounds
0 5 15 22
1 7 12 9
2 4 3 18
3 2 5 10
4 3 11 5

結果は、5 行 3 列の pandas DataFrame になります。

異なる区切り文字を含む文字列がある場合は、 read_csv()関数のsep引数を使用して区切り文字を指定するだけです。

追加リソース

次のチュートリアルでは、パンダで他の一般的なタスクを実行する方法を説明します。

Pandas DataFrame 列を文字列に変換する方法
Pandasでタイムスタンプを日付/時刻に変換する方法
Pandas で DateTime を日付に変換する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です