如何计算 pandas 的滑动最大值(带有示例)
您可以使用以下方法来计算 pandas DataFrame 中的滚动最大值:
方法一:计算滑动最大值
df[' rolling_max '] = df. values_column . cummax ()
方法二:计算每组的滑动最大值
df[' rolling_max '] = df. groupby (' group_column '). values_column . cummax ()
以下示例展示了如何在实践中使用每种方法。
示例1:计算滑动最大值
假设我们有以下 pandas DataFrame,显示商店每天的销售额:
import pandas as pd #createDataFrame df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12], ' sales ': [4, 6, 5, 8, 14, 13, 13, 12, 9, 8, 19, 14]}) #view DataFrame print (df) day sales 0 1 4 1 2 6 2 3 5 3 4 8 4 5 14 5 6 13 6 7 13 7 8 12 8 9 9 9 10 8 10 11 19 11 12 14
我们可以使用以下语法创建一个显示滚动最大销售值的新列:
#add column that displays rolling maximum of sales df[' rolling_max '] = df. dirty . cummax () #view updated DataFrame print (df) day sales rolling_max 0 1 4 4 1 2 6 6 2 3 5 6 3 4 8 8 4 5 14 14 5 6 13 14 6 7 13 14 7 8 12 14 8 9 9 14 9 10 8 14 10 11 19 19 11 12 14 19
标题为Rolling_max的新列显示销售额的滚动最大值。
示例2:计算每组的滑动最大值
假设我们有以下 pandas DataFrame,它显示了两个不同商店每天的销售额:
import pandas as pd #createDataFrame df = pd. DataFrame ({' store ': ['A', 'A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B'], ' day ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12], ' sales ': [4, 6, 5, 8, 14, 13, 13, 12, 9, 8, 19, 14]}) #view DataFrame print (df) store day sales 0 to 1 4 1 to 2 6 2 to 3 5 3 to 4 8 4 to 5 14 5 to 6 13 6 B 7 13 7 B 8 12 8 B 9 9 9 B 10 8 10 B 11 19 11 B 12 14
我们可以使用以下语法创建一个新列,显示按商店分组的滚动最大销售额:
#add column that displays rolling maximum of sales grouped by store df[' rolling_max '] = df. groupby (' store '). dirty . cummax () #view updated DataFrame print (df) store day sales rolling_max 0 A 1 4 4 1 to 2 6 6 2 to 3 5 6 3 to 4 8 8 4 to 5 14 14 5 to 6 13 14 6 B 7 13 13 7 B 8 12 13 8 B 9 9 13 9 B 10 8 13 10 B 11 19 19 11 B 12 14 19
标题为Rolling_max的新列显示按商店分组的滚动销售额最大值。
其他资源
以下教程解释了如何在 pandas 中执行其他常见操作:
如何根据条件删除 Pandas DataFrame 中的行
如何根据多个条件过滤 Pandas DataFrame
如何在 Pandas DataFrame 中使用“NOT IN”过滤器