Як створити дублікат стовпця в pandas dataframe
Ви можете використовувати наступний базовий синтаксис, щоб створити дублікат стовпця в pandas DataFrame:
df[' my_column_duplicate '] = df. loc [:, ' my_column ']
У наступному прикладі показано, як використовувати цей синтаксис на практиці.
Приклад: створіть дублікат стовпця в Pandas DataFrame
Припустімо, що у нас є наступні pandas DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29, 32], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 5], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 8]}) #view DataFrame print (df) points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6 5 23 9 5 6 25 9 9 7 29 4 12 8 32 5 8
Ми можемо використати наступний код, щоб створити дублікат стовпця points і назвати його points_duplicate :
#create duplicate points column
df[' duplicate_points '] = df. loc [:, ' points ']
#view updated DataFrame
print (df)
points assists rebounds points_duplicate
0 25 5 11 25
1 12 7 8 12
2 15 7 10 15
3 14 9 6 14
4 19 12 6 19
5 23 9 5 23
6 25 9 9 25
7 29 4 12 29
8 32 5 8 32
Зверніть увагу, що стовпець points_duplicate містить точно такі ж значення, як і стовпець points .
Зауважте, що назва стовпця-дубліката має відрізнятися від назви вихідного стовпця, інакше стовпець-дублікат не буде створено.
Наприклад, якщо ми спробуємо використати наступний код для створення стовпця-дубліката, це не спрацює:
#attempt to create duplicate points column
df[' points '] = df. loc [:, ' points ']
#view updated DataFrame
print (df)
points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6
5 23 9 5
6 25 9 9
7 29 4 12
8 32 5 8
Не було створено дублікатів стовпців.
Стовпець-дублікат повинен мати іншу назву стовпця, ніж оригінальний стовпець.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові операції в pandas:
Як надрукувати Pandas DataFrame без індексу
Як відобразити всі рядки у Pandas DataFrame
Як перевірити тип усіх стовпців у Pandas DataFrame