Jak korzystać z funkcji pandy value_counts() (z przykładami)
Możesz użyć funkcji value_counts() do zliczenia częstotliwości unikalnych wartości w serii pand.
Ta funkcja wykorzystuje następującą podstawową składnię:
my_series. value_counts ()
Poniższe przykłady pokazują, jak używać tej składni w praktyce.
Przykład 1: Częstotliwość zliczania unikalnych wartości
Poniższy kod pokazuje, jak zliczyć wystąpienia unikalnych wartości w serii pand:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts () 3 4 4 2 7 2 8 1 9 1 dtype: int64
To nam mówi:
- Wartość 3 pojawia się 4 razy.
- Wartość 4 pojawia się dwukrotnie .
- Wartość 7 pojawia się dwukrotnie .
I tak dalej.
Przykład 2: Częstotliwość zliczania unikalnych wartości (w tym NaN)
Domyślnie funkcja value_counts() nie wyświetla częstotliwości wartości NaN.
Można jednak użyć argumentu dropna , aby wyświetlić częstotliwość wartości NaN:
import pandas as pd import numpy as np #create pandas Series with some NaN values my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan]) #count occurrences of unique values in Series, including NaNs my_series. value_counts (dropna= False ) 3.0 4 4.0 2 7.0 2 NaN2 8.0 1 9.0 1 dtype: int64
Przykład 3: Policz względną częstotliwość unikalnych wartości
Poniższy kod pokazuje, jak użyć argumentu normalize do zliczenia względnej częstotliwości unikalnych wartości w serii pand:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (normalize= True ) 3 0.4 4 0.2 7 0.2 8 0.1 9 0.1 dtype:float64
To nam mówi:
- Wartość 3 reprezentuje 40% wszystkich wartości w serii.
- Wartość 4 reprezentuje 20% wszystkich wartości w serii.
- Wartość 7 reprezentuje 20% wszystkich wartości w serii.
I tak dalej.
Przykład 4: Częstotliwość zliczania w pojemnikach
Poniższy kod pokazuje, jak użyć argumentu bins do zliczenia częstotliwości wartości w serii pand, które wpadają do pojemników o jednakowej wielkości:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (bins= 3 ) (3.0, 5.0] 6 (5.0, 7.0] 2 (7.0, 9.0] 2 dtype: int64
To nam mówi:
- Istnieje 6 wartości od 3 do 5.
- Istnieją 2 wartości od 5 do 7.
- Istnieją 2 wartości od 7 do 9.
Przykład 5: Policz częstotliwość wartości w Pandas DataFrame
Możemy również użyć funkcji value_counts() do obliczenia częstotliwości unikalnych wartości w określonej kolumnie pandy DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #count occurrences of unique values in 'points' column df[' points ']. value_counts () 9 3 10 2 13 1 15 1 22 1 Name: points, dtype: int64
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak korzystać z innych typowych funkcji pand:
Jak korzystać z funkcji opisu () w Pandach
Jak policzyć liczbę wierszy w Pandach
Jak liczyć obserwacje grupowe u pand