Jak korzystać z funkcji pandy value_counts() (z przykładami)


Możesz użyć funkcji value_counts() do zliczenia częstotliwości unikalnych wartości w serii pand.

Ta funkcja wykorzystuje następującą podstawową składnię:

 my_series. value_counts ()

Poniższe przykłady pokazują, jak używać tej składni w praktyce.

Przykład 1: Częstotliwość zliczania unikalnych wartości

Poniższy kod pokazuje, jak zliczyć wystąpienia unikalnych wartości w serii pand:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts ()

3 4
4 2
7 2
8 1
9 1
dtype: int64

To nam mówi:

  • Wartość 3 pojawia się 4 razy.
  • Wartość 4 pojawia się dwukrotnie .
  • Wartość 7 pojawia się dwukrotnie .

I tak dalej.

Przykład 2: Częstotliwość zliczania unikalnych wartości (w tym NaN)

Domyślnie funkcja value_counts() nie wyświetla częstotliwości wartości NaN.

Można jednak użyć argumentu dropna , aby wyświetlić częstotliwość wartości NaN:

 import pandas as pd
import numpy as np

#create pandas Series with some NaN values
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan])

#count occurrences of unique values in Series, including NaNs
my_series. value_counts (dropna= False )

3.0 4
4.0 2
7.0 2
NaN2
8.0 1
9.0 1
dtype: int64

Przykład 3: Policz względną częstotliwość unikalnych wartości

Poniższy kod pokazuje, jak użyć argumentu normalize do zliczenia względnej częstotliwości unikalnych wartości w serii pand:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (normalize= True )

3 0.4
4 0.2
7 0.2
8 0.1
9 0.1
dtype:float64

To nam mówi:

  • Wartość 3 reprezentuje 40% wszystkich wartości w serii.
  • Wartość 4 reprezentuje 20% wszystkich wartości w serii.
  • Wartość 7 reprezentuje 20% wszystkich wartości w serii.

I tak dalej.

Przykład 4: Częstotliwość zliczania w pojemnikach

Poniższy kod pokazuje, jak użyć argumentu bins do zliczenia częstotliwości wartości w serii pand, które wpadają do pojemników o jednakowej wielkości:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (bins= 3 )

(3.0, 5.0] 6
(5.0, 7.0] 2
(7.0, 9.0] 2
dtype: int64

To nam mówi:

  • Istnieje 6 wartości od 3 do 5.
  • Istnieją 2 wartości od 5 do 7.
  • Istnieją 2 wartości od 7 do 9.

Przykład 5: Policz częstotliwość wartości w Pandas DataFrame

Możemy również użyć funkcji value_counts() do obliczenia częstotliwości unikalnych wartości w określonej kolumnie pandy DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#count occurrences of unique values in 'points' column
df[' points ']. value_counts ()

9 3
10 2
13 1
15 1
22 1
Name: points, dtype: int64

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak korzystać z innych typowych funkcji pand:

Jak korzystać z funkcji opisu () w Pandach
Jak policzyć liczbę wierszy w Pandach
Jak liczyć obserwacje grupowe u pand

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *