Panda's: een excel-bestand met samengevoegde cellen lezen
Wanneer u een Excel-bestand met samengevoegde cellen in een Panda DataFrame leest, worden de samengevoegde cellen automatisch gevuld met NaN-waarden.
De eenvoudigste manier om deze NaN-waarden in te vullen na het importeren van het bestand is door de functie pandas fillna() als volgt te gebruiken:
df = df. fillna (method=' ffill ', axis= 0 )
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: Lees een Excel-bestand met samengevoegde cellen in Pandas
Laten we zeggen dat we het volgende Excel-bestand hebben met de naam merged_data.xlsx , dat informatie bevat over verschillende basketbalspelers:
Merk op dat de waarden in de kolom Team zijn samengevoegd.
Spelers A tot en met D behoren tot de Mavericks, terwijl spelers E tot en met H tot de Rockets behoren.
Stel dat we de functie read_excel() gebruiken om dit Excel-bestand in een Panda DataFrame te lezen:
import pandas as pd #import Excel fie df = pd. read_excel (' merged_data.xlsx ' ) #view DataFrame print (df) Team Player Points Assists 0 Mavericks A 22 4 1 NaN B 29 4 2 NaN C 45 3 3 NaN D 30 7 4 Rockets E 29 8 5 NaN F 16 6 6 NaN G 25 9 7 NaN H 20 12
Standaard vult panda’s samengevoegde cellen met NaN-waarden.
Om elk van deze NaN-waarden te vullen met de teamnamen, kunnen we de functie fillna() als volgt gebruiken:
#fill in NaN values with team names df = df. fillna (method=' ffill ', axis= 0 ) #view updated DataFrame print (df) Team Player Points Assists 0 Mavericks A 22 4 1 Mavericks B 29 4 2 Mavericks C 45 3 3 Mavericks D 30 7 4 Rockets E 29 8 5 Rockets F 16 6 6 Rockets G 25 9 7 Rockets M 20 12
Houd er rekening mee dat elk van de NaN-waarden is ingevuld met de juiste teamnaam.
Merk op dat het argument axis=0 panda’s vertelt om NaN-waarden verticaal in te vullen.
Om NaN-waarden horizontaal in kolommen te vullen, kunt u axis=1 opgeven.
Opmerking : u kunt de volledige documentatie van de pandas fillna() -functie hier vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:
Panda’s: regels overslaan bij het lezen van een Excel-bestand
Panda’s: typen opgeven bij het importeren van een Excel-bestand
Panda’s: hoe u meerdere Excel-bladen combineert