Panda's: hoe waarde_tellingen als percentage kunnen worden weergegeven
U kunt de functie value_counts() in panda’s gebruiken om het voorkomen van waarden in een bepaalde kolom van een DataFrame te tellen.
Om waarden als percentages weer te geven, kunt u een van de volgende methoden gebruiken:
Methode 1: Geef waarden weer als percentages (opgemaakt als decimalen)
df. my_col . value_counts (normalize= True )
Methode 2: Waarden weergeven als percentages (opgemaakt met procentsymbolen)
df. my_col . value_counts (normalize= True ). mul ( 100 ). round ( 1 ). astype (str) + ' % '
Methode 3: Waardetellingen weergeven als percentages (met tellingen)
counts = df. my_col . value_counts () percs = df. my_col . value_counts (normalize= True ) p.d. concat ([counts, percs], axis= 1 , keys=[' count ', ' percentage '])
De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende panda’s DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'B', 'C'], ' points ': [15, 12, 18, 20, 22, 28, 35, 40]}) #view DataFrame print (df) team points 0 to 15 1 to 12 2 B 18 3 B 20 4 B 22 5 B 28 6 B 35 7 C 40
Voorbeeld 1: Waarden weergeven als percentages (opgemaakt als decimalen)
De volgende code laat zien hoe u het voorkomen van elke waarde in de teamkolom kunt tellen en de voorkomens kunt weergeven als een percentage van het totaal, in decimaal formaat:
#count occurrence of each value in 'team' column as percentage of total df. team . value_counts (normalize= True ) B 0.625 At 0.250 C 0.125 Name: team, dtype: float64
Uit het resultaat kunnen we zien:
- De waarde B vertegenwoordigt 62,5% van de gebeurtenissen in de teamkolom.
- De waarde A vertegenwoordigt 25% van de gebeurtenissen in de teamkolom.
- De C -waarde vertegenwoordigt 12,5% van de gebeurtenissen in de teamkolom.
Houd er rekening mee dat percentages worden opgemaakt als decimalen.
Voorbeeld 2: Waarden weergeven als percentages (opgemaakt met procentsymbolen)
De volgende code laat zien hoe u het aantal keren dat elke waarde in de teamkolom voorkomt, kunt tellen en hoe u het aantal exemplaren kunt weergeven als een percentage van het totaal, opgemaakt met procentsymbolen:
#count occurrence of each value in 'team' column as percentage of total df. team . value_counts (normalize= True ). mul ( 100 ). round ( 1 ). astype (str) + ' % ' B 62.5% At 25.0% C 12.5% Name: team, dtype: object
Houd er rekening mee dat percentages worden opgemaakt als tekenreeksen met procentsymbolen.
Voorbeeld 3: Aantal waarden weergeven als percentages (met cijfers)
De volgende code laat zien hoe u het aantal keren dat elke waarde in de teamkolom voorkomt, kunt tellen en hoe u het aantal exemplaren kunt weergeven als getallen en percentages:
#count occurrence of each value in 'team' column counts = df. team . value_counts () #count occurrence of each value in 'team' column as percentage of total percs = df. team . value_counts (normalize= True ) #concatenate results into one DataFrame p.d. concat ([counts, percs], axis= 1 , keys=[' count ', ' percentage ']) count percentage B 5 0.625 At 2 0.250 C 1 0.125
Houd er rekening mee dat de tellingkolom het aantal van elke unieke waarde in de teamkolom weergeeft, terwijl de percentagekolom elke unieke waarde weergeeft als een percentage van het totale aantal gebeurtenissen.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:
Panda’s: hoe waarderekeningen in kaart te brengen
Panda’s: GroupBy gebruiken en waardetellingen
Panda’s: histogrammen per groep plotten