Come combinare più fogli excel in pandas


Spesso potresti voler importare e combinare più fogli Excel in un singolo DataFrame panda.

Ad esempio, supponiamo di avere la seguente cartella di lavoro di Excel denominata data.xlsx con tre fogli diversi contenenti tutti due colonne di dati sui giocatori di basket:

Possiamo facilmente importare e combinare ogni foglio in un singolo DataFrame panda utilizzando le funzioni panda concat() e read_excel() , ma prima dobbiamo assicurarci che xlrd sia installato:

 pip install xlrd

Una volta installato, possiamo utilizzare il seguente codice per importare e combinare questi tre fogli in un unico Pandas DataFrame:

 #load pandas library
import pandas as pd

#import and combine the three sheets into one pandas DataFrame
df = pd. concat (pd. read_excel ('data.xlsx', sheet_name= None ), ignore_index= True )

#view DataFrame
df

        player points
0 to 12
1 B 5
2 C 13
3 D 17
4 E 27
5 F 24
6 G 26
7:27 a.m.
8 I 27
9 D 12
10K 9
11 L 5
12 M 5
13 N 13
14 O 17

Come funziona questo codice

Ci sono solo due parti per capire come questa singola riga di codice sia in grado di importare e combinare più fogli Excel:

1. Leggi tutti i fogli.

 p.d. read_excel ('data.xlsx', sheet_name= None )

Questo pezzo di codice viene letto in tutti i fogli di una cartella di lavoro di Excel. Per impostazione predefinita, la funzione read_excel() legge solo il primo foglio, ma specificando sheet_name=None possiamo leggere ogni foglio nella cartella di lavoro di Excel.

2. Concatena tutti i fogli.

 p.d. concat ( DataFrames to concatenate , ignore_index= True )

Questo pezzo di codice concatena semplicemente tutti i DataFrame di ciascun foglio Excel in un singolo DataFrame panda. Specificando ignore_index=True , diciamo ai panda che i nomi delle singole foglie non sono importanti.

Tieni presente che questo codice funziona solo se ciascuno dei fogli Excel ha lo stesso formato. In questo esempio, ogni foglio aveva due colonne di dati e ogni colonna aveva lo stesso nome, motivo per cui questa singola riga di codice ha funzionato così facilmente per combinare ciascuno dei fogli Excel in un unico DataFrame panda.

Risorse addizionali

La guida definitiva: come leggere file Excel con Panda
Come scrivere Pandas DataFrames su più fogli Excel

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *