Cara membaca file csv dari string di pandas dataframe


Anda dapat menggunakan sintaks dasar berikut untuk membaca file CSV dari string di pandas DataFrame:

 import pandas as pd
import io   

df = pd. read_csv ( io.StringIO (some_string), sep=" , ")

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh 1: Membaca file CSV dari string dengan koma sebagai pemisah

Kode berikut menunjukkan cara membaca file CSV dari string (dengan koma sebagai pemisah) ke dalam pandas DataFrame:

 import pandas as pd
import io   

some_string="""team,points,rebounds
A,22,10
B,14.9
C,29.6
D,30.2
E,22.9
F,31.10"""

#read CSV string into pandas DataFrame
df = pd. read_csv ( io.StringIO (some_string), sep=" , ")

#view resulting DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

DataFrame panda yang dihasilkan berisi nilai dari string CSV.

Contoh 2: Membaca file CSV dari string dengan titik koma sebagai pemisah

Kode berikut menunjukkan cara membaca file CSV dari string (dengan titik koma sebagai pemisah) ke dalam pandas DataFrame:

 import pandas as pd
import io   

some_string="""team;points;rebounds
A;22;10
B;14;9
C;29;6
D;30;2
E;22;9
F;31;10"""

#read CSV string into pandas DataFrame
df = pd. read_csv ( io.StringIO (some_string), sep=" ; ")

#view resulting DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

DataFrame panda yang dihasilkan berisi nilai dari string CSV.

Contoh 3: Membaca file CSV dari string tanpa header

Kode berikut menunjukkan cara membaca file CSV dari string (tanpa baris header) ke dalam pandas DataFrame:

 import pandas as pd
import io   

some_string="""A;22;10
B;14;9
C;29;6
D;30;2
E;22;9
F;31;10"""

#read CSV string into pandas DataFrame
df = pd. read_csv (io. StringIO (some_string), sep=" ; ", header= None )

#view resulting DataFrame
print (df)

   0 1 2
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

Dengan menggunakan argumen header=None , kami memberi tahu panda untuk tidak menggunakan baris pertama sebagai baris header.

Secara default, panda menggunakan rentang nilai numerik (0, 1, 2) sebagai nama kolom untuk DataFrame.

Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas read_csv() di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya dengan Python:

Pandas: Cara melewati baris saat membaca file CSV
Pandas: Cara menambahkan data ke file CSV yang sudah ada
Pandas: Cara membaca file CSV tanpa header
Pandas: menetapkan nama kolom saat mengimpor file CSV

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *