문자열에서 pandas dataframe을 만드는 방법


다음 기본 구문을 사용하여 문자열에서 pandas DataFrame을 생성할 수 있습니다.

 import pandas as pd
import io   

df = pd. read_csv ( io.StringIO (string_data), sep=" , ")

이 특정 구문은 string_data 라는 문자열에 포함된 값을 사용하여 pandas DataFrame을 생성합니다.

다음 예에서는 이 구문을 실제로 사용하는 방법을 보여줍니다.

예 1: 쉼표 구분 기호를 사용하여 문자열에서 DataFrame 생성

다음 코드는 문자열 값이 쉼표로 구분된 문자열에서 pandas DataFrame을 만드는 방법을 보여줍니다.

 import pandas as pd
import io

#define string
string_data="""points, assists, rebounds
5, 15, 22
7, 12, 9
4, 3, 18
2, 5, 10
3, 11, 5
"""

#create pandas DataFrame from string
df = pd. read_csv ( io.StringIO (string_data), sep=" , ")

#view DataFrame
print (df)

   points assists rebounds
0 5 15 22
1 7 12 9
2 4 3 18
3 2 5 10
4 3 11 5

결과는 5개의 행과 3개의 열이 있는 pandas DataFrame입니다.

예 2: 세미콜론 구분 기호를 사용하여 문자열에서 DataFrame 생성

다음 코드는 문자열 값이 세미콜론으로 구분된 문자열에서 pandas DataFrame을 만드는 방법을 보여줍니다.

 import pandas as pd
import io

#define string
string_data="""points;assists;rebounds
5;15;22
7;12;9
4;3;18
2;5;10
3;11;5
"""

#create pandas DataFrame from string
df = pd. read_csv ( io.StringIO (string_data), sep=" ; ")

#view DataFrame
print (df)

   points assists rebounds
0 5 15 22
1 7 12 9
2 4 3 18
3 2 5 10
4 3 11 5

결과는 5개의 행과 3개의 열이 있는 pandas DataFrame입니다.

구분 기호가 다른 문자열이 있는 경우 read_csv() 함수의 sep 인수를 사용하여 구분 기호를 지정하면 됩니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas DataFrame 열을 문자열로 변환하는 방법
Pandas에서 타임스탬프를 날짜/시간으로 변환하는 방법
Pandas에서 DateTime을 날짜로 변환하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다