大数定律
在本文中,我们解释什么是大数定律以及它在概率和统计中的用途。您还将能够看到大数定律应用的示例,此外,该定律与中心极限定理之间的关系是什么。
什么是大数定律?
在概率论中,大数定律是描述做大量次数的结果的规则。更具体地说,大数定律表明,从大量试验中获得的结果的平均值将接近预期值。
而且,根据大数定律,我们做的实验越多,结果就越接近预期值。
例如,如果我们抛硬币五次,我们只能得到一次正面(20%)。然而,如果将硬币抛掷多次(抛掷超过 1000 次),则几乎一半的结果将是正面(50%),因为这是其预期值。这是大数定律的一个例子。
大数定律的起源可以追溯到 16 世纪的杰罗拉莫·卡尔达诺 (Gerolamo Cardano),但历史上有许多作者参与了这一统计定律的发展:伯努利、泊松、切比雪夫、马尔可夫、博雷尔、坎泰利、柯尔莫哥洛夫和辛钦。
大数定律的例子
看完大数定律的定义后,我们将看一个具体的例子来更好地理解它的含义。在这种情况下,我们将分析通过掷骰子可以获得的可能结果的概率。
掷骰子时有六种可能的结果(1、2、3、4、5 和 6),因此每个基本事件的理论概率为:
因此,我们将模拟几次发射,并将结果记录在频率表中,以检查是否遵守大数定律。
为了让您看到进行的实验数量的重要性,我们将首先模拟十次发射,然后是一百次,最后是一千次。因此,模拟 10 次随机掷骰子得到的结果如下:
正如您所看到的,仅模拟十次投掷所获得的频率概率与理论概率并不相似。
但随着我们增加实验次数,这两个指标变得更加相似,看看 100 次启动的模拟:
现在,为骰子上的每个数字计算的频率概率与其理论概率更加相似,但是,我们仍然得到非常不同的值。
最后,我们执行相同的过程,但模拟 1000 次启动:
正如我们在最后一个表中看到的,现在频率概率的值非常接近理论概率。
总之,我们进行的实验数量越多,事件的频率概率值就越接近其理论发生概率。因此,大数定律受到尊重,因为我们执行的迭代次数越多,实验值与理论值就越相似。
大数定律的限制
大数定律在绝大多数情况下都是有效的,但是,某些类型的概率分布不满足该统计定理。
例如,柯西分布或帕累托分布(α<1)不会随着试验次数的增加而收敛。这是由于分布的尾部很大,这意味着它们没有期望值。
另一方面,有些实验因其自身特性而存在偏差,使研究者出于理性、心理、经济等原因倾向于(有意或无意)修改结果。原因。在这些情况下,大数定律无助于解决偏差,但无论增加试验次数,偏差都会持续存在。
大数定律和中心极限定理
大数定律和中心极限定理是概率论和统计学的两个密切相关的基本规则。所以在本节中我们将了解它们的关系是什么以及它们的区别是什么。
中心极限定理,也称为中心极限定理,表示随着样本量的增加,样本均值的分布接近正态分布,而与总体的概率分布无关。
大数定律和中心极限定理的区别在于,大数定律说的是大量试验的平均值接近其期望值,而中心极限定理说的是许多次试验的平均值样本近似正态分布。