Як додати числовий стовпець до pandas dataframe


Ви можете використовувати наступний базовий синтаксис, щоб додати стовпець «count» до pandas DataFrame:

 df[' var1_count '] = df. groupby (' var1 ')[' var1 ']. transform (' count ')

Цей конкретний синтаксис додає стовпець під назвою var1_count до DataFrame, який містить кількість значень у стовпці під назвою var1 .

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: додайте номерний стовпець у Pandas

Припустімо, що у нас є такий фрейм даних pandas, який містить інформацію про різних баскетболістів:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' pos ': ['Gu', 'Fo', 'Fo', 'Fo', 'Gu', 'Gu', 'Fo', 'Fo'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28]})

#view DataFrame
print (df)

  team pos points
0 A Gu 18
1 A Fo 22
2 A Fo 19
3 B Fo 14
4 B Gu 14
5 B Gu 11
6 B Fo 20
7 B Fo 28

Ми можемо використати наступний код, щоб додати стовпець під назвою team_count , який містить кількість кожної команди:

 #add column that shows total count of each team
df[' team_count '] = df. groupby (' team ')[' team ']. transform (' count ')

#view updated DataFrame
print (df)

  team pos points team_count
0 A Gu 18 3
1 A Fo 22 3
2 A Fo 19 3
3 B Fo 14 5
4 B Gu 14 5
5 B Gu 11 5
6 B Fo 20 5
7 B Fo 28 5

Є 3 лінії з командним значенням A і 5 ліній з командним значенням B.

Так:

  • Для кожного рядка, де команда дорівнює A, значення в стовпці team_count дорівнює 3 .
  • Для кожного рядка, де команда дорівнює B, значення в стовпці team_count дорівнює 5 .

Ви також можете додати стовпець «обліковий запис», який об’єднує декілька змінних.

Наприклад, наступний код показує, як додати стовпець «count», який групує змінні team і pos :

 #add column that shows total count of each team and position
df[' team_pos_count '] = df. groupby ([' team ', ' pos ')[' team ']. transform (' count ')

#view updated DataFrame
print (df)

  team pos points team_pos_count
0 A Gu 18 1
1 A Fo 22 2
2 A Fo 19 2
3 B Fo 14 3
4 B Gu 14 2
5 B Gu 11 2
6 B Fo 20 3
7 B Fo 28 3

З результату ми бачимо:

  • Є 1 рядок, який містить A у стовпчику команди та Gu у стовпчику позиції.
  • Є 2 рядки, які містять A у стовпчику команди та Fo у стовпчику позиції.
  • Є 3 рядки, які містять B у колонці команди та Fo у колонці позиції .
  • Є 2 рядки, які містять B у стовпчику команди та Gu у стовпчику позиції.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:

Pandas: як використовувати GroupBy і підрахунок значень
Pandas: як використовувати GroupBy із підрахунком bin
Pandas: як підрахувати значення в стовпці з умовою

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *