최종 가이드: pandas로 csv 파일을 읽는 방법


CSV(쉼표로 구분된 값) 파일은 데이터를 저장하는 가장 일반적인 방법 중 하나입니다.

다행히 pandas read_csv() 함수를 사용하면 Python에서 원하는 거의 모든 형식의 CSV 파일을 쉽게 읽을 수 있습니다.

이 튜토리얼에서는 “data.csv” 라는 다음 CSV 파일을 사용하여 Python에서 CSV 파일을 읽는 여러 가지 방법을 설명합니다.

 playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22

예 1: Pandas DataFrame으로 CSV 파일 읽기

다음 코드는 CSV 파일을 Pandas DataFrame으로 읽는 방법을 보여줍니다.

 #import CSV file as DataFrame
df = pd. read_csv ('data.csv')

#view DataFrame
df

        playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

예 2: CSV 파일에서 특정 열 읽기

다음 코드는 CSV 파일에서 “playerID” 및 “points”라는 열만 Pandas DataFrame으로 읽는 방법을 보여줍니다.

 #import only specific columns from CSV file
df = pd. read_csv ('data.csv', usecols=[' playerID ',' points '])

#view DataFrame
df

	playerID points
0 1 26
1 2 19
2 3 24
3 4 22

Pandas DataFrame으로 읽을 열 인덱스를 지정할 수도 있습니다.

 #import only specific columns from CSV file
df = pd. read_csv (' data.csv ', usecols=[ 0,1 ])

#view DataFrame
df

        playerID team
0 1 Lakers
1 2 Mavs
2 3 Bucks
3 4 Spurs

예 3: CSV 파일을 가져올 때 헤더 행 지정

경우에 따라 헤더 행이 CSV 파일의 첫 번째 행이 아닐 수도 있습니다.

예를 들어 헤더 행이 실제로 두 번째 행에 나타나는 다음 CSV 파일을 생각해 보세요.

 random,data,values
playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22

이 CSV 파일을 pandas DataFrame으로 읽으려면 다음과 같이 header=1을 지정할 수 있습니다.

 #import from CSV file and specify that header starts on second row
df = pd. read_csv ('data.csv', header= 1 )

#view DataFrame
df

        playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

예 4: CSV 파일을 가져올 때 행 건너뛰기

Skiprows 인수를 사용하면 CSV 파일을 가져올 때 쉽게 행을 건너뛸 수도 있습니다.

예를 들어, 다음 코드는 CSV 파일을 가져올 때 두 번째 줄을 무시하는 방법을 보여줍니다.

 #import from CSV file and skip second row
df = pd. read_csv ('data.csv', skiprows=[ 1 ] )

#view DataFrame
df

        playerID team points
0 2 Mavs 19
1 3 Bucks 24
2 4 Spurs 22

다음 코드는 CSV 파일을 가져올 때 두 번째 세 번째 줄을 무시하는 방법을 보여줍니다.

 #import from CSV file and skip second and third rows
df = pd. read_csv ('data.csv', skiprows=[ 1,2 ] )

#view DataFrame
df

        playerID team points
1 3 Bucks 24
2 4 Spurs 22

예 5: 사용자 정의 구분 기호가 있는 CSV 파일 읽기

때로는 쉼표가 아닌 구분 기호가 포함된 CSV 파일이 있을 수 있습니다.

예를 들어, CSV 파일에 구분 기호로 밑줄이 있다고 가정합니다.

 playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22

이 CSV 파일을 팬더로 읽으려면 sep 인수를 사용하여 파일을 읽을 때 사용할 구분 기호를 지정할 수 있습니다.

 #import from CSV file and specify delimiter to use
df = pd. read_csv ('data.csv', sep=' _ ')

#view DataFrame
df

	playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

추가 리소스

다음 튜토리얼에서는 다른 일반적인 Panda 작업을 수행하는 방법을 설명합니다.

Pandas로 텍스트 파일을 읽는 방법
Pandas로 Excel 파일을 읽는 방법
Pandas로 TSV 파일을 읽는 방법
Pandas로 HTML 테이블을 읽는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다