Hoe pandas value_counts() functie te gebruiken (met voorbeelden)


U kunt de functie value_counts() gebruiken om de frequentie van unieke waarden in een pandareeks te tellen.

Deze functie gebruikt de volgende basissyntaxis:

 my_series. value_counts ()

De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld 1: Telfrequentie van unieke waarden

De volgende code laat zien hoe u unieke waarden in een pandareeks kunt tellen:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts ()

3 4
4 2
7 2
8 1
9 1
dtype: int64

Dit vertelt ons:

  • De waarde 3 verschijnt 4 keer.
  • De waarde 4 verschijnt tweemaal .
  • De waarde 7 verschijnt tweemaal .

Enzovoort.

Voorbeeld 2: Telfrequentie van unieke waarden (inclusief NaN)

Standaard geeft de functie value_counts() de frequentie van NaN-waarden niet weer.

U kunt echter het dropna- argument gebruiken om de frequentie van NaN-waarden weer te geven:

 import pandas as pd
import numpy as np

#create pandas Series with some NaN values
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan])

#count occurrences of unique values in Series, including NaNs
my_series. value_counts (dropna= False )

3.0 4
4.0 2
7.0 2
NaN2
8.0 1
9.0 1
dtype: int64

Voorbeeld 3: Tel de relatieve frequentie van unieke waarden

De volgende code laat zien hoe u het normalize- argument kunt gebruiken om de relatieve frequentie van unieke waarden in een pandareeks te tellen:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (normalize= True )

3 0.4
4 0.2
7 0.2
8 0.1
9 0.1
dtype:float64

Dit vertelt ons:

  • De waarde 3 vertegenwoordigt 40% van alle waarden in de reeks.
  • De waarde 4 vertegenwoordigt 20% van alle waarden in de reeks.
  • De waarde 7 vertegenwoordigt 20% van alle waarden in de reeks.

Enzovoort.

Voorbeeld 4: Telfrequentie in bakken

De volgende code laat zien hoe je het argument bins gebruikt om de frequentie te tellen van waarden in een pandareeks die in bins van gelijke grootte vallen:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (bins= 3 )

(3.0, 5.0] 6
(5.0, 7.0] 2
(7.0, 9.0] 2
dtype: int64

Dit vertelt ons:

  • Er zijn 6 waarden tussen 3 en 5.
  • Er zijn 2 waarden tussen 5 en 7.
  • Er zijn 2 waarden tussen 7 en 9.

Voorbeeld 5: Tel de frequentie van waarden in Pandas DataFrame

We kunnen ook de functie value_counts() gebruiken om de frequentie van unieke waarden in een specifieke kolom van een panda’s DataFrame te berekenen:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#count occurrences of unique values in 'points' column
df[' points ']. value_counts ()

9 3
10 2
13 1
15 1
22 1
Name: points, dtype: int64

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelgebruikte functies in panda’s kunt gebruiken:

Hoe de functie beschrijven() in Panda’s te gebruiken
Hoe het aantal rijen in Panda’s te tellen
Hoe groepswaarnemingen bij panda’s te tellen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert