Hoe de gini-coëfficiënt in python te berekenen (met voorbeeld)
De Gini-coëfficiënt , vernoemd naar de Italiaanse statisticus Corrado Gini , is een manier om de inkomensverdeling van een bevolking te meten.
De waarde van de Gini-coëfficiënt varieert van 0 tot 1, waarbij hogere waarden een grotere inkomensongelijkheid vertegenwoordigen en waarbij:
- 0 staat voor perfecte inkomensgelijkheid (iedereen heeft hetzelfde inkomen)
- 1 staat voor perfecte inkomensongelijkheid (één persoon heeft al het inkomen)
Een lijst met Gini-coëfficiënten per land vindt u hier .
In het volgende voorbeeld ziet u hoe u een Gini-coëfficiënt in Python berekent.
Voorbeeld: bereken de Gini-coëfficiënt in Python
Om een Gini-coëfficiënt in Python te berekenen, moeten we eerst een eenvoudige functie definiëren om een Gini-coëfficiënt te berekenen voor een array van NumPy-waarden:
import numpy as np
#define function to calculate Gini coefficient
def gini(x):
total = 0
for i, xi in enumerate(x[:-1], 1):
total += np. sum (np. abs (xi - x[i:]))
return total / (len(x)**2 * np.mean (x))
Vervolgens zullen we deze functie gebruiken om een Gini-coëfficiënt te berekenen voor een tabel met inkomenswaarden.
Stel dat we bijvoorbeeld de volgende lijst met jaarinkomens voor 10 personen hebben:
Inkomen: $50.000, $50.000, $70.000, $70.000, $70.000, $90.000, $150.000, $150.000, $150.000, $150.000
De volgende code laat zien hoe u de gini()- functie kunt gebruiken die we zojuist hebben gemaakt om de Gini-coëfficiënt voor deze populatie te berekenen:
#define NumPy array of income values
income = np. array ([50, 50, 70, 70, 70, 90, 150, 150, 150, 150])
#calculate Gini coefficient for array of incomes
gini(incomes)
0.226
De Gini-coëfficiënt blijkt 0,226 te zijn.
Opmerking : in een realistisch scenario zouden er honderdduizenden verschillende inkomens zijn voor individuen in een bepaald land, maar in dit voorbeeld gebruikten we 10 individuen als eenvoudige illustratie.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u een Gini-coëfficiënt kunt berekenen met behulp van verschillende statistische software:
Hoe de Gini-coëfficiënt in R te berekenen
Hoe de Gini-coëfficiënt in Excel te berekenen