Cara membaca file csv dari string di pandas dataframe
Anda dapat menggunakan sintaks dasar berikut untuk membaca file CSV dari string di pandas DataFrame:
import pandas as pd import io df = pd. read_csv ( io.StringIO (some_string), sep=" , ")
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh 1: Membaca file CSV dari string dengan koma sebagai pemisah
Kode berikut menunjukkan cara membaca file CSV dari string (dengan koma sebagai pemisah) ke dalam pandas DataFrame:
import pandas as pd import io some_string="""team,points,rebounds A,22,10 B,14.9 C,29.6 D,30.2 E,22.9 F,31.10""" #read CSV string into pandas DataFrame df = pd. read_csv ( io.StringIO (some_string), sep=" , ") #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
DataFrame panda yang dihasilkan berisi nilai dari string CSV.
Contoh 2: Membaca file CSV dari string dengan titik koma sebagai pemisah
Kode berikut menunjukkan cara membaca file CSV dari string (dengan titik koma sebagai pemisah) ke dalam pandas DataFrame:
import pandas as pd import io some_string="""team;points;rebounds A;22;10 B;14;9 C;29;6 D;30;2 E;22;9 F;31;10""" #read CSV string into pandas DataFrame df = pd. read_csv ( io.StringIO (some_string), sep=" ; ") #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
DataFrame panda yang dihasilkan berisi nilai dari string CSV.
Contoh 3: Membaca file CSV dari string tanpa header
Kode berikut menunjukkan cara membaca file CSV dari string (tanpa baris header) ke dalam pandas DataFrame:
import pandas as pd import io some_string="""A;22;10 B;14;9 C;29;6 D;30;2 E;22;9 F;31;10""" #read CSV string into pandas DataFrame df = pd. read_csv (io. StringIO (some_string), sep=" ; ", header= None ) #view resulting DataFrame print (df) 0 1 2 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Dengan menggunakan argumen header=None , kami memberi tahu panda untuk tidak menggunakan baris pertama sebagai baris header.
Secara default, panda menggunakan rentang nilai numerik (0, 1, 2) sebagai nama kolom untuk DataFrame.
Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas read_csv() di sini .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya dengan Python:
Pandas: Cara melewati baris saat membaca file CSV
Pandas: Cara menambahkan data ke file CSV yang sudah ada
Pandas: Cara membaca file CSV tanpa header
Pandas: menetapkan nama kolom saat mengimpor file CSV