Panda: come saltare le righe durante la lettura di un file excel

Di Benjamin anderson Luglio 13, 2023 Guida 0 commenti

È possibile utilizzare i seguenti metodi per saltare le righe durante la lettura di un file Excel in un DataFrame panda:

Metodo 1: salta una riga specifica

 #import DataFrame and skip row in index position 2
df = pd. read_excel (' my_data.xlsx ', skiprows=[ 2 ])

Metodo 2: ignorare più righe specifiche

 #import DataFrame and skip rows in index positions 2 and 4
df = pd. read_excel (' my_data.xlsx ' , skiprows=[2,4 ] )

Metodo 3: ignora le prime N righe

 #import DataFrame and skip first 2 rows
df = pd. read_excel (' my_data.xlsx ', skiprows= 2 )

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente file Excel chiamato player_data.xlsx :

Esempio 1: ignora una riga specifica

Possiamo utilizzare il seguente codice per importare il file Excel e ignorare la riga nella posizione dell’indice 2:

 import pandas as pd

#import DataFrame and skip row in index position 2
df = pd. read_excel (' player_data.xlsx ', skiprows=[ 2 ])

#view DataFrame
print (df)

  team points rebound assists
0 to 24 8 5
1 C 15 4 7
2 D 19 4 8
3 E 32 6 8
4 F 13 7 9

Si noti che la riga nella posizione dell’indice 2 (con la squadra “B”) è stata ignorata durante l’importazione del file Excel nel DataFrame panda.

Nota : la prima riga del file Excel è considerata riga 0.

Esempio 2: ignorare più righe specifiche

Possiamo utilizzare il seguente codice per importare il file Excel e ignorare le righe nelle posizioni dell’indice 2 e 4:

 import pandas as pd

#import DataFrame and skip rows in index positions 2 and 4
df = pd. read_excel (' player_data.xlsx ', skiprows=[ 2,4 ] )

#view DataFrame
print (df)

  team points rebound assists
0 to 24 8 5
1 C 15 4 7
2 E 32 6 8
3 F 13 7 9

Tieni presente che le righe nelle posizioni dell’indice 2 e 4 (con le squadre “B” e “D”) sono state ignorate durante l’importazione del file Excel nel DataFrame panda.

Esempio 3: ignora le prime N righe

Possiamo utilizzare il seguente codice per importare il file Excel e ignorare le prime due righe:

 import pandas as pd

#import DataFrame and skip first 2 rows
df = pd. read_excel (' player_data.xlsx ', skiprows= 2 )

#view DataFrame
print (df)

   B 20 12 3
0 C 15 4 7
1 D 19 4 8
2 E 32 6 8
3 F 13 7 9

Tieni presente che le prime due righe del file Excel sono state saltate e la successiva riga disponibile (con la squadra “B”) è diventata la riga di intestazione del DataFrame.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in Python:

Come leggere file Excel con Panda
Come esportare Pandas DataFrame in Excel
Come esportare un array NumPy in un file CSV

Informazioni sull'autore

Benjamin anderson

Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di più