Cara membagi kolom string di pandas menjadi beberapa kolom


Anda dapat menggunakan sintaks dasar berikut untuk membagi kolom string di pandas DataFrame menjadi beberapa kolom:

 #split column A into two columns: column A and column B
df[[' A ',' B ']] = df[' A ']. str . split (' , ', 1 , expand= True )

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh 1: Bagilah kolom dengan koma

Kode berikut menunjukkan cara membagi kolom di pandas DataFrame, berdasarkan koma, menjadi dua kolom terpisah:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs, West', 'Spurs, West', 'Nets, East'],
                   ' points ': [112, 104, 127]})

#view DataFrame
df

	team points
0 Mavs, West 112
1 Spurs, West 104
2 Nets, East 127

#split team column into two columns
df[[' team ', ' conference ']] = df[' team ']. str . split (' , ', 1 , expand= True )

#view updated DataFrame
df

	team points conference
0 Mavs 112 West
1 Spurs 104 West
2 Nets 127 East

Perhatikan bahwa Anda juga dapat mengatur ulang kolom setelah melakukan pemisahan jika Anda ingin:

 #reorder columns
df = df[[' team ', ' conference ', ' points ']]

#view DataFrame
df

	team conference points
0 Mavs West 112
1 Spurs West 104
2 Nets East 127

Contoh 2: Pisahkan kolom dengan pembatas lainnya

Kita dapat menggunakan sintaks yang sama untuk membagi kolom dengan pembatas lainnya.

Misalnya, kita dapat membagi kolom dengan spasi :

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs West', 'Spurs West', 'Nets East'],
                   ' points ': [112, 104, 127]})

#split team column into two columns
df[[' team ', ' conference ']] = df[' team ']. str . split (' ', 1 , expand= True )

#view updated DataFrame
df

	team conference points
0 Mavs West 112
1 Spurs West 104
2 Nets East 127

Anda juga dapat membagi kolom dengan garis miring :

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs/West', 'Spurs/West', 'Nets/East'],
                   ' points ': [112, 104, 127]})

#split team column into two columns
df[[' team ', ' conference ']] = df[' team ']. str . split (' / ', 1 , expand= True )

#view updated DataFrame
df

	team conference points
0 Mavs West 112
1 Spurs West 104
2 Nets East 127

Dengan menggunakan sintaks ini kita dapat membagi kolom dengan pembatas apa pun yang kita inginkan.

Sumber daya tambahan

Bagaimana cara menambahkan baris ke Pandas DataFrame
Bagaimana cara menambahkan array Numpy ke Pandas DataFrame
Cara menghitung jumlah baris di Pandas DataFrame

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *