如何计算r中的基尼系数(举例)
基尼系数以意大利统计学家科拉多·基尼 (Corrado Gini)的名字命名,是衡量人口收入分配的一种方法。
基尼系数的值范围为0到1,其中值越高代表收入不平等程度越大,其中:
- 0代表完全收入平等(每个人收入相同)
- 1代表完全收入不平等(一个人拥有所有收入)
您可以在此处找到按国家/地区划分的基尼系数列表。
以下示例展示了使用DescTools包中的Gini()函数计算 R 中基尼系数的两种方法。
示例 1:使用个人收入计算基尼系数
假设我们有 10 个人的年收入列表如下:
收入: 50,000 美元、50,000 美元、70,000 美元、70,000 美元、70,000 美元、90,000 美元、150,000 美元、150,000 美元、150,000 美元、150,000 美元
以下代码显示如何使用Gini()函数计算该人群的基尼系数:
library (DescTools) #define vector of income x <- c(50, 50, 70, 70, 70, 90, 150, 150, 150, 150) #calculate Gini coefficient Gini(x, unbiased= FALSE ) [1] 0.226
基尼系数为0.226 。
注:在现实场景中,某个国家的个人会有数十万种不同的收入,但在本例中我们使用 10 个人作为简单说明。
示例 2:使用频率计算基尼系数
假设我们有以下频率表,显示特定人群中具有特定收入的个体数量:
以下代码显示如何使用Gini()函数计算该人群的基尼系数:
library (DescTools) #define vector of income x <- c(10, 20, 25, 55, 70, 90, 110, 115, 130) #define vector of frequencies n <- c(6, 7, 7, 14, 22, 20, 8, 4, 1) #calculate Gini coefficient Gini(x, n, unbiased= FALSE ) [1] 0.2632289
基尼系数为0.26232 。
注意:您可以在此处的DescTools包中找到Gini()函数的完整文档。
其他资源
以下教程介绍了如何计算基尼系数以及如何在 Excel 中创建洛伦兹曲线: