Jak połączyć wiele plików csv w pandach (z przykładem)


Możesz użyć następującej podstawowej składni, aby połączyć wiele plików CSV znajdujących się w tym samym folderze w ramkę DataFrame pandy:

 import pandas as pd
import glob
import bone

#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '

#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))

#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )

Ten konkretny przykład połączy wszystkie pliki CSV znajdujące się w folderze o nazwie my_data_files w pojedynczą ramkę danych Pandas.

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Scal wiele plików CSV w Pandach

Załóżmy, że mam na komputerze folder o nazwie my_data_files , który zawiera trzy pliki CSV:

Każdy plik CSV zawiera dwie kolumny zwane punktami i asystami , które reprezentują punkty i asysty różnych koszykarzy.

Tak wygląda pierwszy plik CSV o nazwie df1 :

Możemy użyć następującej składni, aby połączyć trzy pliki CSV w folderze w pojedynczą ramkę danych pandy:

 import pandas as pd
import glob
import bone

#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '

#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))

#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )

#view resulting DataFrame
print (df)

    assist points
0 4 3
1 5 2
2 5 4
3 6 4
4 8 6
5 9 3
6 2 3
7 10 2
8 14 9
9 15 3
10 6 10
11 8 6
12 9 4

Należy pamiętać, że wszystkie trzy pliki CSV zostały pomyślnie zaimportowane i połączone w jedną ramkę danych.

Ostateczna ramka danych zawiera 13 wierszy i 2 kolumny.

Uwaga : pełną dokumentację funkcji pandy read_csv() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Pythonie:

Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak dodać dane do istniejącego pliku CSV
Pandy: Jak określić typy podczas importowania pliku CSV
Pandy: Jak ustawić nazwy kolumn podczas importowania pliku CSV

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *