Cara menghitung koefisien gini dengan python (dengan contoh)
Dinamakan berdasarkan ahli statistik Italia Corrado Gini , koefisien Gini adalah cara mengukur distribusi pendapatan suatu populasi.
Nilai koefisien Gini berkisar antara 0 sampai 1, dimana nilai yang lebih tinggi menunjukkan ketimpangan pendapatan yang lebih besar dan dimana:
- 0 mewakili kesetaraan pendapatan yang sempurna (setiap orang memiliki pendapatan yang sama)
- 1 mewakili ketimpangan pendapatan sempurna (satu individu mempunyai seluruh pendapatan)
Anda dapat menemukan daftar koefisien Gini menurut negara di sini .
Contoh berikut menunjukkan cara menghitung koefisien Gini dengan Python.
Contoh: hitung koefisien Gini dengan Python
Untuk menghitung koefisien Gini dengan Python, pertama-tama kita perlu mendefinisikan fungsi sederhana untuk menghitung koefisien Gini untuk array nilai NumPy:
import numpy as np
#define function to calculate Gini coefficient
def gini(x):
total = 0
for i, xi in enumerate(x[:-1], 1):
total += np. sum (np. abs (xi - x[i:]))
return total / (len(x)**2 * np.mean (x))
Selanjutnya, kita akan menggunakan fungsi ini untuk menghitung koefisien Gini untuk tabel nilai pendapatan.
Misalnya, kita mempunyai daftar pendapatan tahunan untuk 10 orang berikut ini:
Penghasilan: $50,000, $50,000, $70,000, $70,000, $70,000, $90,000, $150,000, $150,000, $150,000, $150,000
Kode berikut menunjukkan cara menggunakan fungsi gini() yang baru kita buat untuk menghitung koefisien Gini untuk populasi ini:
#define NumPy array of income values
income = np. array ([50, 50, 70, 70, 70, 90, 150, 150, 150, 150])
#calculate Gini coefficient for array of incomes
gini(incomes)
0.226
Koefisien Gini ternyata 0,226 .
Catatan : Dalam skenario dunia nyata, akan ada ratusan ribu pendapatan berbeda untuk individu di negara tertentu, namun dalam contoh ini kami menggunakan 10 individu sebagai ilustrasi sederhana.
Sumber daya tambahan
Tutorial berikut menjelaskan cara menghitung koefisien Gini menggunakan perangkat lunak statistik yang berbeda:
Cara menghitung koefisien Gini di R
Cara menghitung koefisien Gini di Excel