如何在 excel 中执行聚类抽样(分步)
在统计学中,我们经常从总体中抽取样本,并使用样本中的数据得出关于总体总体的结论。
常用的抽样方法是整群抽样,其中将总体分为多个簇,并选择某些簇的所有成员包含在样本中。
以下分步示例展示了如何在 Excel 中执行聚类抽样。
第 1 步:输入数据
首先,我们将以下数据集输入到 Excel 中:
接下来,我们将进行整群抽样,随机选择两支球队,并选择将这两支球队的所有球员纳入最终样本。
第二步:寻找独特的价值
接下来,输入=UNIQUE(B2:B21)从Team列生成唯一值数组:
接下来,我们将在每个唯一团队名称旁边输入一个整数(从 1 开始):
第 3 步:选择随机簇
接下来,我们将输入=RANDBETWEEN(G2, G6)从列表中随机选择一个整数:
单击ENTER后,我们可以看到值5已被随机选择。与此值相关的团队是团队 E,它代表我们将包含在最终样本中的第一个团队。
接下来,双击任意单元格并按Enter 。将从=RANDBETWEEN(G2, G6)函数中选择一个新数字。
我们可以看到值3是随机选择的。与此值关联的团队是团队 C,它代表我们将包含在最终样本中的第二个团队。
第 4 步:过滤最终样品
最终样本将仅包含属于 Team C 或 Team E 的所有玩家。
要仅过滤这些玩家,请突出显示所有数据。然后单击顶部功能区的“数据”选项卡,然后单击“排序和筛选”组中的“筛选”按钮。
当过滤器出现在每列上方时,单击团队列旁边的下拉箭头,然后仅选中团队 C 和 E 旁边的框:
单击“确定”后,数据集将被过滤为仅显示来自 C 队或 E 队的球员:
这代表我们的最终样本。
我们的集群抽样是完整的,因为我们随机选择了两支球队,并将这两支球队的每名球员都纳入了我们的最终样本。
其他资源
以下教程说明如何使用 Excel 在总体中选择其他样本类型: