如何使用 pandas burst() 函数(附示例)


您可以使用 pandas Burst()函数将内联列表的每个元素转换为 DataFrame。

该函数使用以下基本语法:

 df. explode (' variable_to_explode ')

以下示例展示了如何在实践中使用此语法。

示例:将exploitation() 函数与Pandas DataFrame 一起使用

假设我们有以下 pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': [['A', 'B', 'C'], ['D', 'E', 'F'], ['G', 'H', 'I']] ,
                   ' position ':['Guard', 'Forward', 'Center'],
                   ' points ': [7, 14, 19]})

#view DataFrame
df

	team position points
0 [A, B, C] Guard 7
1 [D, E, F] Forward 14
2 [G, H, I] Center 19

请注意,团队列包含团队名称列表。

我们可以使用explode()函数将每个列表的每个元素分解为一行:

 #explode team column
df. explode (' team ')

        team position points
0 A Guard 7
0 B Guard 7
0 C Guard 7
1D Forward 14
1 E Forward 14
1 F Forward 14
2G Center 19
2H Center 19
2 I Center 19

请注意,团队列不再包含列表。我们将每个列表中的每一项“分解”为一行。

另请注意,某些行现在具有相同的索引值。

我们可以使用reset_index()函数在爆破team列时重置索引:

 #explode team column and reset index of resulting dataFrame
df. explode (' team '). reset_index (drop= True )

	team position points
0 A Guard 7
1 B Guard 7
2 C Guard 7
3D Forward 14
4 E Forward 14
5 F Forward 14
6G Center 19
7 A.M. Center 19
8 I Center 19

请注意,现在每一行都有一个唯一的索引值。

其他资源

以下教程解释了如何在 pandas 中执行其他常见操作:

如何将 Pandas 中的字符串列拆分为多列
如何将 Pandas DataFrame 拆分为多个 DataFrame
如何按列值拆分 Pandas DataFrame

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注