如何在 pandas dataframe 中创建重复列


您可以使用以下基本语法在 pandas DataFrame 中创建重复列:

 df[' my_column_duplicate '] = df. loc [:, ' my_column ']

以下示例展示了如何在实践中使用此语法。

示例:在 Pandas DataFrame 中创建重复列

假设我们有以下 pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29, 32],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 5],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 8]})

#view DataFrame
print (df)

   points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6
5 23 9 5
6 25 9 9
7 29 4 12
8 32 5 8

我们可以使用以下代码创建列的副本并将其命名为points_duplicate

 #create duplicate points column
df[' duplicate_points '] = df. loc [:, ' points ']

#view updated DataFrame
print (df)

   points assists rebounds points_duplicate
0 25 5 11 25
1 12 7 8 12
2 15 7 10 15
3 14 9 6 14
4 19 12 6 19
5 23 9 5 23
6 25 9 9 25
7 29 4 12 29
8 32 5 8 32

请注意, points_duplicate列包含与列完全相同的值。

请注意,重复列必须具有与原始列不同的列名,否则将不会创建重复列。

例如,如果我们尝试使用以下代码创建重复列,它将不起作用:

 #attempt to create duplicate points column
df[' points '] = df. loc [:, ' points ']

#view updated DataFrame
print (df)

   points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6
5 23 9 5
6 25 9 9
7 29 4 12
8 32 5 8

没有创建重复的列。

重复列的列名必须与原始列不同。

其他资源

以下教程解释了如何在 pandas 中执行其他常见操作:

如何打印没有索引的 Pandas DataFrame
如何显示 Pandas DataFrame 中的所有行
如何检查 Pandas DataFrame 中所有列的类型

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注