Pandas에서 여러 excel 시트를 결합하는 방법


여러 Excel 시트를 가져와서 단일 Pandas DataFrame으로 결합하려는 경우가 종종 있습니다.

예를 들어 농구 선수 데이터의 두 열이 모두 포함된 세 개의 서로 다른 시트가 있는 data.xlsx 라는 다음 Excel 통합 문서가 있다고 가정합니다.

pandas concat()read_excel() 함수를 사용하여 각 시트를 단일 pandas DataFrame으로 쉽게 가져와 결합할 수 있지만 먼저 xlrd가 설치되어 있는지 확인해야 합니다.

 pip install xlrd

일단 설치되면 다음 코드를 사용하여 이 세 시트를 단일 Pandas DataFrame으로 가져와 결합할 수 있습니다.

 #load pandas library
import pandas as pd

#import and combine the three sheets into one pandas DataFrame
df = pd. concat (pd. read_excel ('data.xlsx', sheet_name= None ), ignore_index= True )

#view DataFrame
df

        player points
0 to 12
1 B 5
2 C 13
3 D 17
4 E 27
5 F 24
6 G 26
7:27 a.m.
8 I 27
9 D 12
10K 9
11 L 5
12 M 5
13 N 13
14 O 17

이 코드는 어떻게 작동하나요?

이 단일 코드 줄이 여러 Excel 시트를 가져오고 결합하는 방법을 이해하는 데는 두 부분만 있습니다.

1. 시트를 모두 읽어보세요.

 p.d. read_excel ('data.xlsx', sheet_name= None )

이 코드 조각은 Excel 통합 문서의 모든 시트를 읽습니다. 기본적으로 read_excel() 함수는 첫 번째 시트만 읽지만 sheet_name=None을 지정하면 Excel 통합 문서의 각 시트를 읽을 수 있습니다.

2. 모든 시트를 연결합니다.

 p.d. concat ( DataFrames to concatenate , ignore_index= True )

이 코드 조각은 단순히 각 Excel 시트의 모든 DataFrame을 단일 Pandas DataFrame으로 연결합니다. ignore_index=True 를 지정함으로써 팬더에게 개별 리프 이름이 중요하지 않음을 알립니다.

이 코드는 각 Excel 시트의 형식이 동일한 경우에만 작동합니다. 이 예에서 각 시트에는 두 개의 데이터 열이 있고 각 열의 이름이 동일합니다. 이것이 바로 이 단일 코드 줄이 각 Excel 시트를 단일 Pandas DataFrame으로 결합하는 데 매우 쉽게 작동하는 이유입니다.

추가 리소스

최종 가이드: Pandas로 Excel 파일을 읽는 방법
여러 Excel 시트에 걸쳐 Pandas DataFrame을 작성하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다