离散概率分布

本文解释了统计学中的离散概率分布。因此,您将了解离散概率分布的含义、离散概率分布的示例以及离散概率分布的不同类型。

什么是离散概率分布?

离散概率分布是定义离散随机变量的概率的分布。因此,离散概率分布只能取有限个值(通常是整数)。

例如,二项分布、泊松分布和超几何分布都是离散概率分布。

在离散概率分布中,代表 (xi )的离散变量的每个值都与范围从 0 到 1 的概率值 (p i ) 相关联。因此,离散分布中所有概率的总和给出的结果是。

\begin{array}{c}P[X=x_i]=p_i \quad i=1,2,\ldots, n\\[2ex]0\leq p_i\leq 1\\[2ex]\displaystyle\sum_{i=0}^{n}p_i=1\end{array}

离散概率分布的示例

现在我们知道了离散概率分布的定义,我们将看到此类分布的几个示例,以更好地理解这个概念。

离散概率分布的示例:

  1. 掷骰子30次,得到数字5的次数。
  2. 一天内访问某个网页的用户数量。
  3. 总共 50 名学生中通过考试的学生人数。
  4. 100 个产品样本中的缺陷单位数。
  5. 一个人必须参加驾驶考试才能通过的次数。

离散概率分布的类型

离散概率分布的主要类型有:

  • 离散均匀分布
  • 伯努利分布
  • 二项分布
  • 鱼类分布
  • 多项分布
  • 几何分布
  • 负二项分布
  • 超几何分布

下面详细解释每种类型的离散概率分布。

离散均匀分布

离散均匀分布是一种离散概率分布,其中所有值都是等概率的,即在离散均匀分布中,所有值出现的概率相同。

例如,骰子的滚动可以用离散均匀分布来定义,因为所有可能的结果(1、2、3、4、5 或 6)具有相同的发生概率。

一般来说,离散均匀分布有两个特征参数ab ,它们定义了分布可以取的可能值的范围。因此,当变量由离散均匀分布定义时,它被写为Uniform(a,b)

X\sim \text{Uniforme}(a,b)

离散均匀分布可以用来描述随机实验,因为如果所有结果具有相同的概率,则意味着实验是随机的。

伯努利分布

伯努利分布,也称为二分分布,是一种概率分布,表示只能有两种结果的离散变量:“成功”或“失败”。

在伯努利分布中,“成功”是我们期望的结果,其值为 1,而“失败”的结果是与预期不同的结果,其值为 0。因此,如果“结果的概率” “成功”的结果为p ,“失败”结果的概率为q=1-p

\begin{array}{c}X\sim \text{Bernoulli}(p)\\[2ex]\begin{array}{l} \text{\'Exito}\ \color{orange}\bm{\longrightarrow}\color{black} \ P[X=1]=p\\[2ex]\text{Fracaso}\ \color{orange}\bm{\longrightarrow}\color{black} \ P[X=0]=q=1-p\end{array}\end{array}

伯努利分布以瑞士统计学家雅各布·伯努利的名字命名。

在统计学中,伯努利分布主要有一个应用:定义实验的概率,其中只有两种可能的结果:成功和失败。因此,使用伯努利分布的实验称为伯努利测试或伯努利实验。

二项分布

二项分布,也称为二项分布,是一种概率分布,在以恒定的成功概率进行一系列独立的二分实验时,统计成功的次数。换句话说,二项分布是描述一系列伯努利试验的成功结果数量的分布。

例如,一枚硬币出现 25 次正面的次数就是二项式分布。

一般来说,执行的实验总数由参数n定义,而p是每个实验成功的概率。因此,服从二项式分布的随机变量可写为:

X\sim\text{Bin}(n,p)

请注意,在二项分布中,完全相同的实验重复n次,并且实验彼此独立,因此每次实验成功的概率是相同的(p)

鱼类分布

泊松分布是一种概率分布,定义了一段时间内发生给定数量的事件的概率。换句话说,泊松分布用于对随机变量进行建模,这些随机变量描述现象在时间间隔内重复的次数。

例如,电话交换机每分钟接收的呼叫数量是一个离散随机变量,可以使用泊松分布来定义。

泊松分布有一个特征参数,用希腊字母 λ 表示,表示所研究的事件在给定时间间隔内预计发生的次数。

X\sim \text{Poisson}(\lambda)

参见:鱼类分布公式

多项分布

多项式分布(或多项式分布)是一种概率分布,描述了经过多次试验后,若干互斥事件发生给定次数的概率。

也就是说,如果一个随机实验可以产生三个或更多的排他事件,并且每个事件单独发生的概率已知,则使用多项分布来计算当进行多个实验时,一定数量的事件发生的概率。每次的时间。

因此,多项分布是二项分布的推广。

参见:多项分布公式

几何分布

几何分布是一种概率分布,定义了获得第一个成功结果所需的伯努利试验次数。也就是说,几何分布模型是重复伯努利实验直到其中一个实验获得肯定结果的过程。

例如,在道路上行驶直到看到黄色汽车的汽车数量是几何分布。

请记住,伯努利测试是一种有两种可能结果的实验:“成功”和“失败”。因此,如果“成功”的概率为p ,则“失败”的概率为q=1-p

因此,几何分布取决于参数p ,它是所有进行的实验成功的概率。此外,所有实验的概率p都是相同的。

X\sim\text{Geom\'etrica}(p)

参见:几何分布公式

负二项分布

负二项分布是一种概率分布,描述获得给定数量的正结果所需的伯努利试验次数。

因此,负二项式分布具有两个特征参数: r是期望的成功结果的数量, p是执行的每个伯努利实验的成功概率。

X\sim \text{BN}(r,p)

因此,负二项式分布定义了一个过程,其中根据需要进行尽可能多的伯努利试验以获得正结果。此外,所有这些伯努利试验都是独立的,并且成功的概率恒定。

例如,服从负二项式分布的随机变量是骰子必须滚动的次数,直到数字 6 滚动 3 次为止。

超几何分布

超几何分布是一种概率分布,描述了在不替换总体中的n 个元素的情况下随机提取的成功案例的数量。

也就是说,超几何分布用于计算当从总体中提取n个元素而不替换其中任何一个时获得x次成功的概率。

因此,超几何分布具有三个参数:

  • N :总体中元素的数量(N = 0, 1, 2,…)。
  • K :是最大成功案例数(K = 0, 1, 2,…,N)。由于在超几何分布中,一个元素只能被视为“成功”或“失败”,因此NK是失败案例的最大数量。
  • n :是执行的无替换读取的次数。

X \sim HG(N,K,n)

离散和连续概率分布

最后,我们将看到离散概率分布和连续概率分布之间的区别,因为了解如何区分这两种类型的分布非常重要。

离散分布和连续分布的区别在于它们可以取值的数量。连续分布可以取任意值,而离散分布不接受任何值而只能取有限个值。

区分连续分布和离散分布的一种方法是确定它们可以包含什么类型的数字。通常,连续分布可以采用任何值,包括小数,而离散分布只能采用整数。请记住,此技巧并不适用于所有情况,但适用于绝大多数情况。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注