Pandas: как создать столбец, если он не существует


Вы можете использовать следующий базовый синтаксис для создания столбца в DataFrame pandas, если он еще не существует:

 df[' my_column '] = df. get (' my_column ', df[' col1 '] * df[' col2 ']) 

Этот конкретный синтаксис создает новый столбец с именем my_column , если он еще не существует в DataFrame и определяется как произведение существующих столбцов col1 и col2 .

В следующем примере показано, как использовать этот синтаксис на практике.

Пример: создайте столбец в Pandas, если он не существует.

Предположим, у нас есть следующий DataFrame pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],
                   ' sales ': [4, 6, 5, 8, 14, 13, 13, 12, 9, 8, 19, 14],
                   ' price ': [1, 2, 2, 1, 2, 4, 4, 3, 3, 2, 2, 3]})

#view DataFrame
print (df)

    day sales price
0 1 4 1
1 2 6 2
2 3 5 2
3 4 8 1
4 5 14 2
5 6 13 4
6 7 13 4
7 8 12 3
8 9 9 3
9 10 8 2
10 11 19 2
11 12 14 3

Теперь предположим, что мы пытаемся добавить столбец с именем цена , если он еще не существует, и определить его как столбец, в котором каждое значение равно 100:

 #attempt to add column called 'price'
df[' price '] = df. get (' price ', 100)    

#view updated DataFrame
print (df)

    day sales price
0 1 4 1
1 2 6 2
2 3 5 2
3 4 8 1
4 5 14 2
5 6 13 4
6 7 13 4
7 8 12 3
8 9 9 3
9 10 8 2
10 11 19 2
11 12 14 3

Поскольку столбец с именем цена уже существует, pandas просто не добавляет его в DataFrame.

Однако предположим, что мы пытаемся добавить новый столбец с именем « Доход» , если он еще не существует, и определить его как столбец, значения которого являются произведением столбцов «Продажи» и «Цена»:

 #attempt to add column called 'revenue'
df[' revenue '] = df. get (' revenue ', df[' sales '] * df[' price '])

#view updated DataFrame
print (df)

    day sales price revenue
0 1 4 1 4
1 2 6 2 12
2 3 5 2 10
3 4 8 1 8
4 5 14 2 28
5 6 13 4 52
6 7 13 4 52
7 8 12 3 36
8 9 9 3 27
9 10 8 2 16
10 11 19 2 38
11 12 14 3 42

Этот столбец дохода добавляется в DataFrame, поскольку он еще не существует.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:

Как удалить строки в Pandas DataFrame в зависимости от условия
Как фильтровать DataFrame Pandas по нескольким условиям
Как использовать фильтр «НЕ В» в Pandas DataFrame

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *