Jak odczytać plik csv za pomocą numpy (krok po kroku)
Możesz użyć następującej podstawowej składni, aby wczytać plik CSV do tablicy rekordów w NumPy:
from numpy import genfromtxt my_data = genfromtxt(' data.csv ', delimiter=' , ', dtype= None )
Poniższy przykład krok po kroku pokazuje, jak zastosować tę składnię w praktyce.
Krok 1: Wyświetl plik CSV
Załóżmy, że mamy następujący plik CSV o nazwie data.csv , który chcielibyśmy wczytać do NumPy:
Krok 2: Wczytaj do pliku CSV
Poniższy kod pokazuje, jak odczytać ten plik CSV do tablicy Numpy:
from numpy import genfromtxt #import CSV file my_data = genfromtxt(' data.csv ', delimiter=' , ', dtype= None )
Zwróć uwagę na następujące kwestie:
- delimiter : Określa separator oddzielający wartości danych w pliku CSV.
- dtype : Określa typ danych tablicy NumPy. Używając opcji Brak , umożliwiamy import do tabeli wielu typów danych jednocześnie.
Przykład 3: Pokaż tablicę NumPy
Po zaimportowaniu pliku CSV możemy go wyświetlić:
#view imported CSV file
my_data
array([[1, 2, 2, 2, 3, 4],
[5, 5, 6, 8, 9, 9]])
Widzimy, że dane w tablicy NumPy odpowiadają danym pokazanym w pliku CSV.
Uwaga : Pełną dokumentację online funkcji genfromtxt() można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe funkcje z plikami CSV w pandach:
Jak czytać pliki CSV za pomocą Pand
Jak wyeksportować ramkę danych Pandas do pliku CSV
Pandy: Jak dodać dane do istniejącego pliku CSV