Pandas에서 여러 csv 파일을 병합하는 방법(예제 포함)


다음 기본 구문을 사용하여 동일한 폴더에 있는 여러 CSV 파일을 Pandas DataFrame으로 병합할 수 있습니다.

 import pandas as pd
import glob
import bone

#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '

#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))

#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )

이 특정 예에서는 my_data_files 라는 폴더에 있는 모든 CSV 파일을 단일 Pandas DataFrame으로 병합합니다.

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: Pandas에서 여러 CSV 파일 병합

내 컴퓨터에 세 개의 CSV 파일이 포함된 my_data_files 라는 폴더가 있다고 가정해 보겠습니다.

각 CSV 파일에는 다양한 농구 선수의 포인트어시스트 를 나타내는 포인트 및 어시스트라는 두 개의 열이 포함되어 있습니다.

df1 이라는 첫 번째 CSV는 다음과 같습니다.

다음 구문을 사용하여 폴더에 있는 세 개의 CSV 파일을 단일 Pandas DataFrame으로 병합할 수 있습니다.

 import pandas as pd
import glob
import bone

#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '

#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))

#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )

#view resulting DataFrame
print (df)

    assist points
0 4 3
1 5 2
2 5 4
3 6 4
4 8 6
5 9 3
6 2 3
7 10 2
8 14 9
9 15 3
10 6 10
11 8 6
12 9 4

세 개의 CSV 파일이 모두 성공적으로 가져와서 단일 DataFrame으로 병합되었습니다.

최종 DataFrame에는 13개의 행과 2개의 열이 포함됩니다.

참고 : 여기에서 pandas read_csv() 함수에 대한 전체 문서를 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 Python에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas: CSV 파일을 읽을 때 줄을 건너뛰는 방법
Pandas: 기존 CSV 파일에 데이터를 추가하는 방법
Pandas: CSV 파일을 가져올 때 유형을 지정하는 방법
Pandas: CSV 파일을 가져올 때 열 이름을 설정하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다