系统抽样

在本文中,我们解释什么是系统抽样、其特征以及如何进行。您还将看到系统抽样的示例。此外,您还将了解系统抽样的优点和缺点以及何时应使用这种类型的抽样。

什么是系统抽样?

系统抽样是一种概率方法,用于选择统计研究样本中的元素。在系统抽样中,首先随机选择一个元素,然后以固定间隔选择样本中的其他元素。

系统抽样

因此,在系统抽样中,一旦我们从样本中随机选择了第一个个体,我们就需要计算所需间隔的数量,以从样本中抽取下一个个体。我们依次重复相同的过程,直到样本中的个体数量与我们希望获得的样本量一样多。

另一方面,您应该知道有更多方法可以从样本中选择个体。最常用的抽样类型是:

  • 简单随机抽样
  • 分层抽样
  • 系统抽样
  • 整群抽样

在 probabilistica.com,我们对每种类型的概率抽样都有详细的解释,因此如果您更感兴趣,您可以在我们的网站上搜索每种类型的概率抽样是如何执行的。

如何进行系统抽样

进行系统随机抽样的步骤如下:

  1. 定义目标人群。
  2. 确定所需的样本量
  3. 计算采样间隔。为此,将总体规模除以样本规模。
  4. 随机选择样本中的第一项。
  5. 选择样本的其余元素。为此,采样间隔会连续添加到上一步中选择的数字上。

系统抽样中选择的第一个项目是随机的,这一点很重要,因为它实际上是样本中唯一随机选择的项目。否则,系统抽样的随机性就会受到影响。这就是为什么研究人员必须确保总体中的所有元素都有相同的概率被选为起点。

同样,由于系统抽样中的样本元素是间隔选取的,因此最终样本中可能不存在某种类型的元素,因此样本的代表性也不够充分。但这是我们进行系统抽样时面临的风险。

最后,您必须考虑到采样间隔不是模型,因为这样所选的样本将不充分,统计研究将给出不可靠的结果。

系统抽样示例

了解系统抽样的定义后,我们将解释此类抽样的示例,以便您更好地理解其含义。

例如,如果我们希望对 1000 个元素的总体进行系统抽样以获得 50 个元素的样本,则必须按以下步骤进行。

首先,我们需要计算采样间隔。为此,我们只需将总体规模除以样本规模:

k=\cfrac{1000}{50}=20

其次,我们需要随机选择样本中的第一个受试者。要执行此步骤,有多种方法,但您可以使用例如计算机程序Excel来获取1到20之间的随机数(建议第一个数字位于第一个片段中)。假设我们得到数字 17。

\text{primer elemento de la poblaci\'on} = 17

接下来,我们需要将采样间隔 (20) 添加到数字 17,以从样本中选择下一个元素。我们需要再选择 49 个数字,因为所需的样本量是 50。

\text{muestra}= 17, 37, 57, 77, 97, 117,\ldots ,997

因此,认同所得出的数字的人口元素被选为统计研究样本的一部分。

系统抽样的优点和缺点

系统抽样有以下优点和缺点:

优势 缺点
系统抽样的执行速度非常快。 如果存在一个模式并且它与采样间隔匹配,您将得到一个有偏差的样本。
这很容易理解。 在所选样本中,仅随机选择一个元素。
获得的样品通常具有代表性。 一旦选择了初始主题,某些项目被选择的概率为零。
系统抽样不限于总体的一部分,而是对分布在整个总体中的元素进行抽样。 变化的估计比简单的随机抽样系统更复杂。

正如我们在上面的示例中看到的,系统抽样既快速又容易执行。尽管看起来可能并非如此,但该属性很重要,因为它涉及较低的经济成本。

系统抽样的另一个积极方面是它从整个总体中进行抽样。另一方面,在其他类型的抽样中,我们可以仅从总体的前半部分中获取元素。

系统抽样的缺点是总体元素的排列顺序会影响统计结果的可靠性,因为如果存在某种周期性或模式,则可能会获得有偏差的样本。例如,如果我们对男性和女性人口进行如下排序:

\text{M}\quad \text{H}\quad  \text{M}\quad \text{H}\quad  \text{M}\quad \text{H}\quad  \text{M}\quad \text{H}\quad  \text{M}\quad \text{H}\quad  \text{M} \quad \text{H}

按照这个顺序,如果我们采用 2 的采样间隔,我们将根据原点仅选择女性或仅选择男性。因此,我们将获得不可靠的样本。

最后,系统抽样的另一个负面方面是,仅随机选择一个元素,这会影响样本中的其余元素。与其他类型的抽样不同,其他类型的抽样在整个过程中存在更多的机会。

何时使用系统抽样

最后,我们向您展示什么时候可以使用系统抽样,什么时候不可以,因为这种抽样系统并不总是可用。

当需要简单且快速实施的抽样方法时,可以使用系统抽样。换句话说,当项目预算有限时,系统抽样是一个非常好的选择,因为它只需要很少的资源来执行。

正如我们在整篇文章中所看到的,当总体表现出某种类型的模式时,使用这种类型的抽样是不切实际的,因为可能会获得有偏差的样本。

最后,如果总体中有许多不同的群体,或者换句话说,如果它有很多阶层,那么最好使用分层抽样,因为它允许对阶层进行单独的统计分析,而这不允许系统抽样。

请参阅:分层抽样

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注