Python'da gini katsayısı nasıl hesaplanır (örnekle)
Adını İtalyan istatistikçi Corrado Gini’den alan Gini katsayısı , bir nüfusun gelir dağılımını ölçmenin bir yoludur.
Gini katsayısının değeri 0 ila 1 arasında değişir; burada daha yüksek değerler daha büyük gelir eşitsizliğini temsil eder ve burada:
- 0 mükemmel gelir eşitliğini temsil eder (herkes aynı gelire sahiptir)
- 1 tam gelir eşitsizliğini temsil eder (bir kişi tüm gelire sahiptir)
Ülkelere göre Gini katsayılarının bir listesini burada bulabilirsiniz.
Aşağıdaki örnek Python’da bir Gini katsayısının nasıl hesaplanacağını gösterir.
Örnek: Python’da Gini katsayısını hesaplayın
Python’da bir Gini katsayısını hesaplamak için öncelikle bir dizi NumPy değeri için Gini katsayısını hesaplayacak basit bir fonksiyon tanımlamamız gerekir:
import numpy as np
#define function to calculate Gini coefficient
def gini(x):
total = 0
for i, xi in enumerate(x[:-1], 1):
total += np. sum (np. abs (xi - x[i:]))
return total / (len(x)**2 * np.mean (x))
Daha sonra bu fonksiyonu, gelir değerleri tablosu için Gini katsayısını hesaplamak için kullanacağız.
Örneğin 10 kişinin yıllık gelirinin aşağıdaki listeye sahip olduğunu varsayalım:
Gelir: 50.000 $, 50.000 $, 70.000 $, 70.000 $, 70.000 $, 90.000 $, 150.000 $, 150.000 $, 150.000 $, 150.000 $
Aşağıdaki kod, bu popülasyon için Gini katsayısını hesaplamak üzere az önce oluşturduğumuz gini() fonksiyonunun nasıl kullanılacağını gösterir:
#define NumPy array of income values
income = np. array ([50, 50, 70, 70, 70, 90, 150, 150, 150, 150])
#calculate Gini coefficient for array of incomes
gini(incomes)
0.226
Gini katsayısı 0,226 olarak çıkıyor.
Not : Gerçek dünya senaryosunda, belirli bir ülkedeki bireylerin yüzbinlerce farklı geliri olacaktır, ancak bu örnekte basit bir örnek olarak 10 kişiyi kullandık.
Ek kaynaklar
Aşağıdaki eğitimlerde farklı istatistiksel yazılımlar kullanılarak bir Gini katsayısının nasıl hesaplanacağı açıklanmaktadır:
R’deki Gini katsayısı nasıl hesaplanır?
Excel’de Gini katsayısı nasıl hesaplanır