Pandas: como ler um arquivo excel com células mescladas
Quando você lê um arquivo Excel com células mescladas em um DataFrame do pandas, as células mescladas serão preenchidas automaticamente com valores NaN.
A maneira mais fácil de preencher esses valores NaN após importar o arquivo é usar a função pandas fillna() da seguinte maneira:
df = df. fillna (method=' ffill ', axis= 0 )
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: Leia um arquivo Excel com células mescladas no Pandas
Digamos que temos o seguinte arquivo Excel chamado merged_data.xlsx que contém informações sobre vários jogadores de basquete:
Observe que os valores na coluna Equipe estão mesclados.
Os jogadores de A a D pertencem aos Mavericks, enquanto os jogadores de E a H pertencem aos Rockets.
Suponha que usemos a função read_excel() para ler este arquivo Excel em um DataFrame do pandas:
import pandas as pd #import Excel fie df = pd. read_excel (' merged_data.xlsx ' ) #view DataFrame print (df) Team Player Points Assists 0 Mavericks A 22 4 1 NaN B 29 4 2 NaN C 45 3 3 NaN D 30 7 4 Rockets E 29 8 5 NaN F 16 6 6 NaN G 25 9 7 NaN H 20 12
Por padrão, o pandas preenche as células mescladas com valores NaN.
Para preencher cada um desses valores NaN com os nomes dos times, podemos usar a função fillna() da seguinte forma:
#fill in NaN values with team names df = df. fillna (method=' ffill ', axis= 0 ) #view updated DataFrame print (df) Team Player Points Assists 0 Mavericks A 22 4 1 Mavericks B 29 4 2 Mavericks C 45 3 3 Mavericks D 30 7 4 Rockets E 29 8 5 Rockets F 16 6 6 Rockets G 25 9 7 Rockets M 20 12
Observe que cada um dos valores NaN foi preenchido com o nome do time apropriado.
Observe que o argumento axis=0 diz ao pandas para preencher os valores NaN verticalmente.
Para preencher valores NaN horizontalmente em colunas, você pode especificar axis=1 .
Nota : Você pode encontrar a documentação completa da função pandas fillna() aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:
Pandas: como pular linhas ao ler um arquivo Excel
Pandas: como especificar tipos ao importar um arquivo Excel
Pandas: como combinar várias planilhas do Excel