Як розділити рядковий стовпець у pandas на кілька стовпців


Ви можете використовувати наступний базовий синтаксис, щоб розділити рядковий стовпець у pandas DataFrame на кілька стовпців:

 #split column A into two columns: column A and column B
df[[' A ',' B ']] = df[' A ']. str . split (' , ', 1 , expand= True )

Наступні приклади показують, як використовувати цей синтаксис на практиці.

Приклад 1: Розділіть стовпець комою

Наступний код показує, як розділити стовпець у pandas DataFrame на основі коми на два окремі стовпці:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs, West', 'Spurs, West', 'Nets, East'],
                   ' points ': [112, 104, 127]})

#view DataFrame
df

	team points
0 Mavs, West 112
1 Spurs, West 104
2 Nets, East 127

#split team column into two columns
df[[' team ', ' conference ']] = df[' team ']. str . split (' , ', 1 , expand= True )

#view updated DataFrame
df

	team points conference
0 Mavs 112 West
1 Spurs 104 West
2 Nets 127 East

Зауважте, що ви також можете змінити порядок стовпців після виконання розбиття, якщо хочете:

 #reorder columns
df = df[[' team ', ' conference ', ' points ']]

#view DataFrame
df

	team conference points
0 Mavs West 112
1 Spurs West 104
2 Nets East 127

Приклад 2: розділити стовпець іншими роздільниками

Ми можемо використовувати той самий синтаксис, щоб розділити стовпець іншими роздільниками.

Наприклад, ми можемо розділити стовпець пробілом :

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs West', 'Spurs West', 'Nets East'],
                   ' points ': [112, 104, 127]})

#split team column into two columns
df[[' team ', ' conference ']] = df[' team ']. str . split (' ', 1 , expand= True )

#view updated DataFrame
df

	team conference points
0 Mavs West 112
1 Spurs West 104
2 Nets East 127

Ви також можете розділити стовпець косою рискою :

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs/West', 'Spurs/West', 'Nets/East'],
                   ' points ': [112, 104, 127]})

#split team column into two columns
df[[' team ', ' conference ']] = df[' team ']. str . split (' / ', 1 , expand= True )

#view updated DataFrame
df

	team conference points
0 Mavs West 112
1 Spurs West 104
2 Nets East 127

Використовуючи цей синтаксис, ми можемо розділити стовпець будь-яким роздільником, який забажаємо.

Додаткові ресурси

Як додати рядки до Pandas DataFrame
Як додати масив Numpy до Pandas DataFrame
Як підрахувати кількість рядків у Pandas DataFrame

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *