Pandy: jak odczytać plik excel ze scalonymi komórkami
Kiedy wczytujesz plik Excel ze scalonymi komórkami do ramki DataFrame pandy, scalone komórki zostaną automatycznie wypełnione wartościami NaN.
Najłatwiejszym sposobem wypełnienia tych wartości NaN po zaimportowaniu pliku jest użycie funkcji pandas fillna() w następujący sposób:
df = df. fillna (method=' ffill ', axis= 0 )
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Przeczytaj plik Excel ze scalonymi komórkami w Pandach
Załóżmy, że mamy następujący plik Excel o nazwie merged_data.xlsx , który zawiera informacje o różnych koszykarzach:
Zauważ, że wartości w kolumnie Zespół zostały scalone.
Gracze od A do D należą do Mavericks, a gracze od E do H do Rockets.
Załóżmy, że używamy funkcji read_excel() do wczytania pliku Excel do ramki DataFrame pandy:
import pandas as pd #import Excel fie df = pd. read_excel (' merged_data.xlsx ' ) #view DataFrame print (df) Team Player Points Assists 0 Mavericks A 22 4 1 NaN B 29 4 2 NaN C 45 3 3 NaN D 30 7 4 Rockets E 29 8 5 NaN F 16 6 6 NaN G 25 9 7 NaN H 20 12
Domyślnie pandy wypełniają scalone komórki wartościami NaN.
Aby wypełnić każdą z tych wartości NaN nazwami zespołów, możemy użyć funkcji fillna() w następujący sposób:
#fill in NaN values with team names df = df. fillna (method=' ffill ', axis= 0 ) #view updated DataFrame print (df) Team Player Points Assists 0 Mavericks A 22 4 1 Mavericks B 29 4 2 Mavericks C 45 3 3 Mavericks D 30 7 4 Rockets E 29 8 5 Rockets F 16 6 6 Rockets G 25 9 7 Rockets M 20 12
Należy pamiętać, że każda z wartości NaN została wypełniona odpowiednią nazwą zespołu.
Zauważ, że argument oś=0 mówi pandom, aby wypełniły wartości NaN w pionie.
Aby wypełnić wartości NaN w kolumnach poziomo, możesz określić oś=1 .
Uwaga : pełną dokumentację funkcji pandas fillna() można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:
Pandy: Jak pominąć linie podczas czytania pliku Excel
Pandy: Jak określić typy podczas importowania pliku Excel
Pandy: Jak połączyć wiele arkuszy Excela