Pandas:如何将 dataframe 从宽变为长


您可以使用以下基本语法将 pandas DataFrame 从宽格式转换为长格式:

 df = pd. melt (df, id_vars=' col1 ', value_vars=[' col2 ', ' col3 ', ...])

在这种情况下, col1是我们用作标识符的列, col2col3等。是我们撤消其枢轴的列。

以下示例展示了如何在实践中使用此语法。

示例:将 Pandas DataFrame 从宽调整为长

假设我们有以下 pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D'],
                   ' points ': [88, 91, 99, 94],
                   ' assists ': [12, 17, 24, 28],
                   ' rebounds ': [22, 28, 30, 31]})

#view DataFrame
df

	team points assists rebounds
0 A 88 12 22
1 B 91 17 28
2 C 99 24 30
3 D 94 28 31

我们可以使用以下语法将此 DataFrame 从宽格式重塑为长格式:

 #reshape DataFrame from wide format to long format
df = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '])

#view updated DataFrame
df

	team variable value
0 A points 88
1 B points 91
2 C dots 9 9
3 D dots 94
4 A assists 12
5 B assists 17
6 C assists 24
7 D assists 28
8 A rebounds 22
9 B rebounds 28
10 C rebounds 30
11 D rebounds 31

DataFrame 现在采用长格式。

我们使用“球队”列作为标识列,并取消了“得分”、“助攻”和“篮板”列的透视。

请注意,我们还可以使用var_namevalue_name参数来指定新的长 DataFrame 中的列名称:

 #reshape DataFrame from wide format to long format
df = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '],
             var_name=' metric ', value_name=' amount ')

#view updated DataFrame
df

	team metric amount
0 A points 88
1 B points 91
2 C points 99
3 D dots 94
4 A assists 12
5 B assists 17
6 C assists 24
7 D assists 28
8 A rebounds 22
9 B rebounds 28
10 C rebounds 30
11 D rebounds 31

注意:您可以在此处找到 pandas Melt()函数的完整文档。

其他资源

以下教程解释了如何在 Python 中执行其他常见操作:

如何向 Pandas DataFrame 添加行
如何向 Pandas DataFrame 添加列
如何统计Pandas DataFrame中特定值的出现次数

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注