什么是无记忆财产? (定义&;示例)
在统计学中,如果未来事件发生的概率不受过去事件发生的影响,则概率分布被称为具有无记忆特性。
具有无记忆特性的概率分布只有两种:
这两个概率分布用于对事件发生之前的预期时间进行建模。
事实证明,在任何给定时间,知道已经过去了多少时间实际上并不能告诉我们某个事件更有可能早点发生还是晚点发生。
下面的例子可以帮助我们对无记忆特性有一个更好的直觉。
没有记忆的财产直觉
考虑以下示例:
不是没有记忆
据了解,某品牌的笔记本电脑平均使用寿命约为6年。因此,如果我们知道某台笔记本电脑已经使用了 5 年,那么预计它报废的时间就会非常短。然而,如果另一台笔记本电脑只有 1 年的历史,那么预计它报废的时间就会相当长。
在此示例中,了解每台笔记本电脑的使用寿命已经过去了多少时间,就可以告诉我们笔记本电脑将继续运行多长时间,直到其报废。所以如果没有记忆,这个概率分布就没有属性。
没有记忆
我猜杰西卡拥有一家便利店。她想知道她需要等待多长时间才能下一位顾客进入商店。
在此示例中,了解最后一位顾客进入商店的时间对于预测下一位顾客何时进入商店并没有真正的用处,因为每个顾客都是独立的并且表现出个人行为。
所以这个概率分布将具有无记忆的特性。换句话说,未来事件发生的概率不受过去事件发生的影响。
无记忆属性:正式定义
用正式的统计术语来说,如果对于a和b ,则随机变量X遵循具有无记忆特性的概率分布 在 {0, 1, 2, …} 中,以下事实成立:
Pr(X > a + b | X ≥ a ) = Pr(X > b )
例如,假设我们有一个具有无记忆特性的概率分布, X是第一次成功之前的试验次数。如果a = 30 且b = 10 那么我们会说:
- Pr(X > a + b | X ≥ a ) = Pr(X > b )
- Pr(X > 30 + 10 | X ≥ 30 ) = Pr(X > 10)
- Pr(X > 40 | X ≥ 30 ) = Pr(X > 10)
换句话说,如果我们有 30 次不成功的试验,那么我们必须等到试验 #40 或更晚的时间才能获得成功的概率与从头开始并等到试验 #10 的概率相同。或更多才能成功。
由于这种概率分布具有无记忆特性,这意味着知道我们在某个点之前发生的故障数量仍然不能告诉我们未来发生故障的概率。
无记忆属性:一个例子
假设平均每小时有 30 名顾客进入一家商店,并且到达之间的时间呈指数分布。连续访问之间平均间隔 2 分钟。
假设距离最后一位顾客到达已经过去了 10 分钟。鉴于这是一个异常长的时间段,客户似乎更有可能在一分钟内到达。
然而,由于指数分布具有无记忆特性,因此事实并非如此。等待下一位顾客到达所花费的时间并不取决于自上一位顾客到达以来的时间。
我们可以使用指数分布的 CDF 来证明这一点:
CDF: 1 – e -λx
其中 λ 计算为 1/平均到达间隔时间。在我们的示例中,λ = 1/2 = 0.5。
如果我们设置a = 10 和b = 1,那么我们有:
- Pr(X > a + b | X ≥ a ) = Pr(X > b )
- Pr( X > 10 + 1 |
无论距离上一位顾客到达已经过去了多少时间,距离下一位顾客到达时间超过一分钟的概率都是0.6065 。