Como mesclar vários arquivos csv no pandas (com exemplo)


Você pode usar a seguinte sintaxe básica para mesclar vários arquivos CSV localizados na mesma pasta em um DataFrame do pandas:

 import pandas as pd
import glob
import bone

#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '

#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))

#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )

Este exemplo específico irá mesclar todos os arquivos CSV localizados na pasta chamada my_data_files em um único Pandas DataFrame.

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: mesclar vários arquivos CSV no Pandas

Digamos que eu tenha uma pasta no meu computador chamada my_data_files que contém três arquivos CSV:

Cada arquivo CSV contém duas colunas chamadas pontos e assistências , que representam os pontos e assistências de diferentes jogadores de basquete.

Esta é a aparência do primeiro CSV chamado df1 :

Podemos usar a seguinte sintaxe para mesclar os três arquivos CSV na pasta em um único DataFrame do pandas:

 import pandas as pd
import glob
import bone

#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '

#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))

#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )

#view resulting DataFrame
print (df)

    assist points
0 4 3
1 5 2
2 5 4
3 6 4
4 8 6
5 9 3
6 2 3
7 10 2
8 14 9
9 15 3
10 6 10
11 8 6
12 9 4

Observe que todos os três arquivos CSV foram importados e mesclados com sucesso em um único DataFrame.

O DataFrame final contém 13 linhas e 2 colunas.

Nota : Você pode encontrar a documentação completa da função read_csv() do pandas aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em Python:

Pandas: Como pular linhas ao ler um arquivo CSV
Pandas: como adicionar dados a um arquivo CSV existente
Pandas: como especificar tipos ao importar um arquivo CSV
Pandas: Como definir nomes de colunas ao importar um arquivo CSV

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *