R에서 지니 계수를 계산하는 방법(예제 포함)
이탈리아 통계학자인 Corrado Gini 의 이름을 딴 지니 계수는 인구의 소득 분포를 측정하는 방법입니다.
지니 계수의 값 범위는 0에서 1까지이며, 값이 높을수록 소득 불평등이 커짐을 나타냅니다.
- 0은 완전한 소득 평등(모든 사람이 동일한 소득을 가짐)을 나타냅니다.
- 1은 완전 소득 불평등을 나타냅니다(한 개인이 모든 소득을 소유함).
여기에서 국가별 지니 계수 목록을 확인할 수 있습니다.
다음 예에서는 DescTools 패키지의 Gini() 함수를 사용하여 R에서 Gini 계수를 계산하는 두 가지 방법을 보여줍니다.
예시 1: 개인 소득을 사용하여 지니 계수 계산
10명의 연간 소득 목록이 다음과 같이 있다고 가정합니다.
소득: $50,000, $50,000, $70,000, $70,000, $70,000, $90,000, $150,000, $150,000, $150,000, $150,000
다음 코드는 Gini() 함수를 사용하여 이 모집단의 지니 계수를 계산하는 방법을 보여줍니다.
library (DescTools) #define vector of income x <- c(50, 50, 70, 70, 70, 90, 150, 150, 150, 150) #calculate Gini coefficient Gini(x, unbiased= FALSE ) [1] 0.226
지니계수는 0.226 으로 나타났다.
참고 : 실제 시나리오에서는 특정 국가의 개인 소득이 수십만 가지에 달하지만 이 예에서는 간단한 예시로 개인 10명을 사용했습니다.
예 2: 주파수를 사용하여 지니 계수 계산
특정 인구 집단에서 특정 소득을 가진 개인의 수를 보여주는 다음과 같은 빈도표가 있다고 가정합니다.
다음 코드는 Gini() 함수를 사용하여 이 모집단의 지니 계수를 계산하는 방법을 보여줍니다.
library (DescTools) #define vector of income x <- c(10, 20, 25, 55, 70, 90, 110, 115, 130) #define vector of frequencies n <- c(6, 7, 7, 14, 22, 20, 8, 4, 1) #calculate Gini coefficient Gini(x, n, unbiased= FALSE ) [1] 0.2632289
지니계수는 0.26232 로 나타났다.
참고 : 여기에서 DescTools 패키지의 Gini() 함수에 대한 전체 문서를 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 지니 계수를 계산하는 방법과 Excel에서 로렌츠 곡선을 만드는 방법을 설명합니다.