如何在 excel 中执行聚类抽样(分步)


在统计学中,我们经常从总体中抽取样本,并使用样本中的数据得出关于总体总体的结论。

常用的抽样方法是整群抽样,其中将总体分为多个簇,并选择某些簇的所有成员包含在样本中。

以下分步示例展示了如何在 Excel 中执行聚类抽样。

第 1 步:输入数据

首先,我们将以下数据集输入到 Excel 中:

接下来,我们将进行整群抽样,随机选择两支球队,并选择将这两支球队的所有球员纳入最终样本。

第二步:寻找独特的价值

接下来,输入=UNIQUE(B2:B21)Team列生成唯一值数组:

接下来,我们将在每个唯一团队名称旁边输入一个整数(从 1 开始):

第 3 步:选择随机簇

接下来,我们将输入=RANDBETWEEN(G2, G6)从列表中随机选择一个整数:

单击ENTER后,我们可以看到值5已被随机选择。与此值相关的团队是团队 E,它代表我们将包含在最终样本中的第一个团队。

接下来,双击任意单元格并按Enter 。将从=RANDBETWEEN(G2, G6)函数中选择一个新数字。

我们可以看到值3是随机选择的。与此值关联的团队是团队 C,它代表我们将包含在最终样本中的第二个团队。

第 4 步:过滤最终样品

最终样本将仅包含属于 Team C 或 Team E 的所有玩家。

要仅过滤这些玩家,请突出显示所有数据。然后单击顶部功能区的“数据”选项卡,然后单击“排序和筛选”组中的“筛选”按钮。

当过滤器出现在每列上方时,单击团队列旁边的下拉箭头,然后仅选中团队 C 和 E 旁边的框:

单击“确定”后,数据集将被过滤为仅显示来自 C 队或 E 队的球员:

这代表我们的最终样本。

我们的集群抽样是完整的,因为我们随机选择了两支球队,并将这两支球队的每名球员都纳入了我们的最终样本。

其他资源

以下教程说明如何使用 Excel 在总体中选择其他样本类型:

如何在Excel中选择随机样本
如何在 Excel 中进行系统抽样
Excel中如何进行分层抽样

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注