如何取消 pandas dataframe 的透视(举例)


在 pandas 中,您可以使用Melt()函数来取消透视 DataFrame——将其从宽格式转换为长格式

该函数使用以下基本语法:

 df_unpivot = pd. melt (df, id_vars=' col1 ', value_vars=[' col2 ', ' col3 ', ...])

金子:

  • id_vars :用作标识符的列
  • value_vars :要取消透视的列

以下示例展示了如何在实践中使用此语法。

示例:反转 Pandas DataFrame

假设我们有以下 pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'],
                   ' points ': [18, 22, 19, 14, 14],
                   ' assists ': [5, 7, 7, 9, 12],
                   ' rebounds ': [11, 8, 10, 6, 6]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6

我们可以使用以下语法来“逆透视”DataFrame:

 #unpivot DataFrame from wide format to long format
df_unpivot = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '])

#view updated DataFrame
print (df_unpivot)

   team variable value
0 A points 18
1 B points 22
2 C points 19
3 D dots 14
4 E points 14
5 A assists 5
6 B assists 7
7 C assists 7
8 D assists 9
9 E assists 12
10 A rebounds 11
11 B rebounds 8
12 C rebounds 10
13 D rebounds 6
14 E rebounds 6

我们使用球队列作为标识符列,并选择不轮换得分、助攻篮板

结果是一个长格式的 DataFrame。

请注意,我们还可以使用var_namevalue_name参数来指定未旋转 DataFrame 中的列名称:

 #unpivot DataFrame from wide format to long format
df_unpivot = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '],
             var_name=' metric ', value_name=' amount ')

#view updated DataFrame
print (df_unpivot)

   team metric amount
0 A points 18
1 B points 22
2 C points 19
3 D dots 14
4 E points 14
5 A assists 5
6 B assists 7
7 C assists 7
8 D assists 9
9 E assists 12
10 A rebounds 11
11 B rebounds 8
12 C rebounds 10
13 D rebounds 6
14 E rebounds 6

请注意,新列现在的标题为MetricAmount

其他资源

以下教程解释了如何在 Python 中执行其他常见操作:

如何向 Pandas DataFrame 添加行
如何向 Pandas DataFrame 添加列
如何统计Pandas DataFrame中特定值的出现次数

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注