Python에서 지니 계수를 계산하는 방법(예제 포함)
이탈리아 통계학자인 Corrado Gini 의 이름을 딴 지니 계수는 인구의 소득 분포를 측정하는 방법입니다.
지니 계수의 값 범위는 0에서 1까지이며, 값이 높을수록 소득 불평등이 커짐을 나타냅니다.
- 0은 완전한 소득 평등(모든 사람이 동일한 소득을 가짐)을 나타냅니다.
- 1은 완전 소득 불평등을 나타냅니다(한 개인이 모든 소득을 소유함).
여기에서 국가별 지니 계수 목록을 확인할 수 있습니다.
다음 예에서는 Python에서 지니 계수를 계산하는 방법을 보여줍니다.
예: Python에서 지니 계수 계산
Python에서 지니 계수를 계산하려면 먼저 NumPy 값 배열에 대한 지니 계수를 계산하는 간단한 함수를 정의해야 합니다.
import numpy as np
#define function to calculate Gini coefficient
def gini(x):
total = 0
for i, xi in enumerate(x[:-1], 1):
total += np. sum (np. abs (xi - x[i:]))
return total / (len(x)**2 * np.mean (x))
다음으로, 이 함수를 사용하여 소득 값 표의 지니 계수를 계산하겠습니다.
예를 들어, 10명의 연간 소득 목록이 다음과 같이 있다고 가정합니다.
소득: $50,000, $50,000, $70,000, $70,000, $70,000, $90,000, $150,000, $150,000, $150,000, $150,000
다음 코드는 방금 생성한 gini() 함수를 사용하여 이 모집단의 지니 계수를 계산하는 방법을 보여줍니다.
#define NumPy array of income values
income = np. array ([50, 50, 70, 70, 70, 90, 150, 150, 150, 150])
#calculate Gini coefficient for array of incomes
gini(incomes)
0.226
지니계수는 0.226 으로 나타났다.
참고 : 실제 시나리오에서는 특정 국가의 개인 소득이 수십만 가지에 달하지만 이 예에서는 간단한 설명으로 10명의 개인을 사용했습니다.
추가 리소스
다음 튜토리얼에서는 다양한 통계 소프트웨어를 사용하여 지니 계수를 계산하는 방법을 설명합니다.