Pandas: csv 파일을 가져올 때 유형을 지정하는 방법
CSV 파일을 pandas로 가져올 때 다음 기본 구문을 사용하여 DataFrame의 각 열 유형을 지정할 수 있습니다.
df = pd. read_csv (' my_data.csv ', dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })
dtype 인수는 CSV 파일을 Pandas DataFrame으로 가져올 때 각 열에 있어야 하는 데이터 유형을 지정합니다.
다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.
예: CSV 파일을 Pandas로 가져올 때 유형 지정
Basketball_data.csv 라는 다음과 같은 CSV 파일이 있다고 가정해 보겠습니다.
read_csv() 함수를 사용하여 CSV 파일을 가져오면 pandas는 각 열의 데이터 유형을 자동으로 식별하려고 시도합니다.
import pandas as pd #import CSV file df = pd. read_csv (' basketball_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10 #view data type of each column print ( df.dtypes ) team object int64 dots rebounds int64 dtype:object
결과에서 DataFrame의 열에 다음과 같은 데이터 유형이 있음을 알 수 있습니다.
- 팀 :객체
- 포인트 : int64
- 반송 : int64
그러나 read_csv() 함수의 dtype 인수를 사용하여 각 열의 데이터 유형을 지정할 수 있습니다.
import pandas as pd #import CSV file and specify dtype of each column df = pd. read_csv (' basketball_data.csv ', dtype = {' team ': str , ' points ': float , ' rebounds ': int })) #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10 #view data type of each column print ( df.dtypes ) team object float64 points rebounds int32 dtype:object
결과에서 DataFrame의 열에 다음과 같은 데이터 유형이 있음을 알 수 있습니다.
- 팀 :객체
- 포인트 : float64
- 반송 : int32
이러한 데이터 유형은 dtype 인수를 사용하여 지정한 데이터 유형에 해당합니다.
이 예에서는 DataFrame의 각 열에 대한 유형을 지정했습니다.
그러나 특정 열에 대해서만 유형을 지정하고 팬더가 나머지 열에 대한 유형을 추론하도록 선택할 수 있습니다.
참고 : 여기에서 pandas read_csv() 함수에 대한 전체 문서를 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Pandas: CSV 파일을 읽을 때 줄을 건너뛰는 방법
Pandas: 기존 CSV 파일에 데이터를 추가하는 방법
Pandas: 헤더 없이 CSV 파일을 읽는 방법
Pandas: CSV 파일을 가져올 때 열 이름을 설정하는 방법