Hoe pandas value_counts() functie te gebruiken (met voorbeelden)
U kunt de functie value_counts() gebruiken om de frequentie van unieke waarden in een pandareeks te tellen.
Deze functie gebruikt de volgende basissyntaxis:
my_series. value_counts ()
De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld 1: Telfrequentie van unieke waarden
De volgende code laat zien hoe u unieke waarden in een pandareeks kunt tellen:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts () 3 4 4 2 7 2 8 1 9 1 dtype: int64
Dit vertelt ons:
- De waarde 3 verschijnt 4 keer.
- De waarde 4 verschijnt tweemaal .
- De waarde 7 verschijnt tweemaal .
Enzovoort.
Voorbeeld 2: Telfrequentie van unieke waarden (inclusief NaN)
Standaard geeft de functie value_counts() de frequentie van NaN-waarden niet weer.
U kunt echter het dropna- argument gebruiken om de frequentie van NaN-waarden weer te geven:
import pandas as pd import numpy as np #create pandas Series with some NaN values my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan]) #count occurrences of unique values in Series, including NaNs my_series. value_counts (dropna= False ) 3.0 4 4.0 2 7.0 2 NaN2 8.0 1 9.0 1 dtype: int64
Voorbeeld 3: Tel de relatieve frequentie van unieke waarden
De volgende code laat zien hoe u het normalize- argument kunt gebruiken om de relatieve frequentie van unieke waarden in een pandareeks te tellen:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (normalize= True ) 3 0.4 4 0.2 7 0.2 8 0.1 9 0.1 dtype:float64
Dit vertelt ons:
- De waarde 3 vertegenwoordigt 40% van alle waarden in de reeks.
- De waarde 4 vertegenwoordigt 20% van alle waarden in de reeks.
- De waarde 7 vertegenwoordigt 20% van alle waarden in de reeks.
Enzovoort.
Voorbeeld 4: Telfrequentie in bakken
De volgende code laat zien hoe je het argument bins gebruikt om de frequentie te tellen van waarden in een pandareeks die in bins van gelijke grootte vallen:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (bins= 3 ) (3.0, 5.0] 6 (5.0, 7.0] 2 (7.0, 9.0] 2 dtype: int64
Dit vertelt ons:
- Er zijn 6 waarden tussen 3 en 5.
- Er zijn 2 waarden tussen 5 en 7.
- Er zijn 2 waarden tussen 7 en 9.
Voorbeeld 5: Tel de frequentie van waarden in Pandas DataFrame
We kunnen ook de functie value_counts() gebruiken om de frequentie van unieke waarden in een specifieke kolom van een panda’s DataFrame te berekenen:
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #count occurrences of unique values in 'points' column df[' points ']. value_counts () 9 3 10 2 13 1 15 1 22 1 Name: points, dtype: int64
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelgebruikte functies in panda’s kunt gebruiken:
Hoe de functie beschrijven() in Panda’s te gebruiken
Hoe het aantal rijen in Panda’s te tellen
Hoe groepswaarnemingen bij panda’s te tellen