位置测量
本文解释了什么是位置测量及其用途。因此,您将找到所有位置测量以及每种类型的示例。
什么是位置测量?
位置是帮助定义一组数据的测量统计参数。简而言之,位置测量可以帮助我们了解数据集的样子。
在统计学中,有两种类型的位置测量:中心位置测量,用于确定数据集的中心值,以及非中心位置测量,用于将数据划分为相等的区间。 。
什么是位置测量?
在统计学中,位置测量是:
- 中心位置测量:指示分布的中心值。
- 平均值:这是样本中所有数据的平均值。
- 中位数:这是所有数据从小到大排序的中间值。
- 众数:这是数据集中重复次数最多的值。
- 非中心位置测量:将数据集分成相等的部分。
- 四分位数:将数据样本分为四个相同的部分。
- 五分位数:将数据分成五个相等的部分。
- 十分位数:将数据集划分为十个大小相等的区间。
- 百分位数:将数据分成一百等份。
下面更详细地解释每种类型的位置测量。
中心位置测量
中心位置测量指示分布的中心值,也就是说,它们用于查找代表数据集中心的值。中心位置主要有三种衡量标准:均值、中位数和众数。
一半
要计算平均值,请将所有值相加,然后除以观察总数。因此,平均值的公式如下:
平均值也称为算术平均值或平均数。此外,统计分布的平均值相当于其数学期望。
中位数
中位数是所有数据从小到大排序的中间值。换句话说,中位数将有序数据集分成相等的两部分。
中位数的计算取决于数据总数是偶数还是奇数:
- 如果数据总数为奇数,则中位数将是位于数据正中间的值。也就是说排序后的数据中位于(n+1)/2位置的值。
- 如果数据点总数为偶数,则中位数为位于中心的两个数据点的平均值。也就是说,在有序数据的 n/2 和 n/2+1 位置处找到的值的算术平均值。
金子
是样本中数据的总数, Me是中位数。
时尚
在统计学中,众数是数据集中绝对频率最高的值,即众数是数据集中出现次数最多的值。
因此,要计算统计数据集的众数,只需统计每个数据项在样本中出现的次数,重复次数最多的数据项就是众数。
众数也可以说是统计众数或众数。
根据最多重复值的数量可以区分三种模式:
- 单峰模式:只有一个值具有最大重复次数。例如,[1,4,2,4,5,3]。
- 双峰模式:最大重复次数出现在两个不同的值处,并且两个值重复的次数相同。例如,[2,6,7,2,3,6,9]。
- 多峰模式:三个或更多值具有相同的最大重复次数。例如,[3,3,4,1,3,4,2,1,4,5,2,1]。
非中心位置测量
非中心位置测量用于将统计数据集划分为相等的区间。非中心位置度量主要有四种类型:四分位数、五分位数、十分位数和百分位数。
四分位数
在统计学中,四分位数是将数据集分为四个相等部分的三个值。因此,第一、第二和第三四分位数分别代表所有统计数据的 25%、50% 和 75%。
四分位数由大写 Q 和四分位数索引表示,因此第一个四分位数是 Q 1 ,第二个四分位数是 Q 2 ,第三个四分位数是 Q 3 。
五分位数
五分位数是将有序数据集分为五个相等部分的四个值。因此,第一、第二、第三和第四五分位数分别代表样本数据的 20%、40%、60% 和 80%。
例如,第三个五分位数代表收集的所有数据的 60% 以上,但小于其余数据。
五分位数的符号是带有五分位数索引的大写字母K,即第一五分位数为K 1 ,第二五分位数为K 2 ,第三五分位数为K 3 ,第四五分位数为K 4 。尽管它也可以用字母 Q 表示(不推荐,因为它会与四分位数产生混淆)。
十分位数
十分位数是将一组有序数据分为十个相等部分的九个值。因此,第一、第二、第三……十分位数代表样本或总体的 10%、20%、30%……。
例如,第四个十分位数值高于数据的 40%,但低于其余数据。
一般情况下,十分位由大写字母 D 和十分位索引表示,即第一个十分位为 D 1 ,第二个十分位为 D 2 ,第三个十分位为 D 3 ,依此类推。
百分位数
百分位数是将一组有序数据分成一百等份的值。因此,百分位表示数据集的百分比低于该值的值。
例如,第 35 个百分位值高于观测数据的 35%,但低于其余数据。
百分位数由大写字母P和百分位数索引表示,即第1个百分位数为P 1 ,第40个百分位数为P 40 ,第79个百分位数为P 79 ,依此类推。