Como mesclar vários arquivos csv no pandas (com exemplo)
Você pode usar a seguinte sintaxe básica para mesclar vários arquivos CSV localizados na mesma pasta em um DataFrame do pandas:
import pandas as pd
import glob
import bone
#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '
#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))
#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )
Este exemplo específico irá mesclar todos os arquivos CSV localizados na pasta chamada my_data_files em um único Pandas DataFrame.
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: mesclar vários arquivos CSV no Pandas
Digamos que eu tenha uma pasta no meu computador chamada my_data_files que contém três arquivos CSV:
Cada arquivo CSV contém duas colunas chamadas pontos e assistências , que representam os pontos e assistências de diferentes jogadores de basquete.
Esta é a aparência do primeiro CSV chamado df1 :
Podemos usar a seguinte sintaxe para mesclar os três arquivos CSV na pasta em um único DataFrame do pandas:
import pandas as pd
import glob
import bone
#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '
#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))
#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )
#view resulting DataFrame
print (df)
assist points
0 4 3
1 5 2
2 5 4
3 6 4
4 8 6
5 9 3
6 2 3
7 10 2
8 14 9
9 15 3
10 6 10
11 8 6
12 9 4
Observe que todos os três arquivos CSV foram importados e mesclados com sucesso em um único DataFrame.
O DataFrame final contém 13 linhas e 2 colunas.
Nota : Você pode encontrar a documentação completa da função read_csv() do pandas aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em Python:
Pandas: Como pular linhas ao ler um arquivo CSV
Pandas: como adicionar dados a um arquivo CSV existente
Pandas: como especificar tipos ao importar um arquivo CSV
Pandas: Como definir nomes de colunas ao importar um arquivo CSV