Jak połączyć wiele arkuszy excela w pandach


Często możesz chcieć zaimportować i połączyć wiele arkuszy programu Excel w jedną ramkę DataFrame pand.

Załóżmy na przykład, że masz następujący skoroszyt programu Excel o nazwie data.xlsx z trzema różnymi arkuszami, z których każdy zawiera dwie kolumny danych koszykarzy:

Możemy łatwo zaimportować i połączyć każdy arkusz w pojedynczą ramkę DataFrame pandy, używając funkcji pandas concat() i read_excel() , ale najpierw musimy się upewnić, że xlrd jest zainstalowany:

 pip install xlrd

Po zainstalowaniu możemy użyć następującego kodu, aby zaimportować i połączyć te trzy arkusze w jedną ramkę danych Pandas:

 #load pandas library
import pandas as pd

#import and combine the three sheets into one pandas DataFrame
df = pd. concat (pd. read_excel ('data.xlsx', sheet_name= None ), ignore_index= True )

#view DataFrame
df

        player points
0 to 12
1 B 5
2 C 13
3 D 17
4 E 27
5 F 24
6 G 26
7:27 a.m.
8 I 27
9 D 12
10K 9
11 L 5
12 M 5
13 N 13
14 O 17

Jak działa ten kod

Istnieją tylko dwie części zrozumienia, w jaki sposób ta pojedyncza linia kodu może importować i łączyć wiele arkuszy Excela:

1. Przeczytaj wszystkie arkusze.

 p.d. read_excel ('data.xlsx', sheet_name= None )

Ten fragment kodu jest odczytywany we wszystkich arkuszach skoroszytu programu Excel. Domyślnie funkcja read_excel() czyta tylko pierwszy arkusz, ale po podaniu nazwa_arkusza=None możemy odczytać każdy arkusz w skoroszycie programu Excel.

2. Połącz wszystkie arkusze.

 p.d. concat ( DataFrames to concatenate , ignore_index= True )

Ten fragment kodu po prostu łączy wszystkie ramki danych z każdego arkusza programu Excel w pojedynczą ramkę danych pandy. Określając ignorowanie_index=True , mówimy pandom, że nazwy poszczególnych liści nie są ważne.

Pamiętaj, że ten kod działa tylko wtedy, gdy każdy arkusz Excela ma ten sam format. W tym przykładzie każdy arkusz zawierał dwie kolumny danych, a każda kolumna miała tę samą nazwę, dlatego też ten pojedynczy wiersz kodu tak łatwo zadziałał, łącząc każdy arkusz Excela w pojedynczą ramkę DataFrame pandy.

Dodatkowe zasoby

Kompletny przewodnik: jak czytać pliki Excel za pomocą Pand
Jak pisać ramki danych Pandas w wielu arkuszach Excela

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *