Pandas value_counts() 함수 사용 방법(예제 포함)


value_counts() 함수를 사용하여 팬더 시리즈에서 고유한 값의 빈도를 계산할 수 있습니다.

이 함수는 다음 기본 구문을 사용합니다.

 my_series. value_counts ()

다음 예에서는 이 구문을 실제로 사용하는 방법을 보여줍니다.

예시 1: 고유 값의 빈도 계산

다음 코드는 Pandas 시리즈에서 고유 값의 발생 횟수를 계산하는 방법을 보여줍니다.

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts ()

3 4
4 2
7 2
8 1
9 1
dtype: int64

이는 우리에게 다음을 알려줍니다.

  • 값 3이 4 번 나타납니다.
  • 값 4가 두 번 나타납니다.
  • 값 7이 두 번 나타납니다.

등등.

예시 2: 고유 값의 카운트 빈도(NaN 포함)

기본적으로 value_counts() 함수는 NaN 값의 빈도를 표시하지 않습니다.

그러나 dropna 인수를 사용하여 NaN 값의 빈도를 표시할 수 있습니다.

 import pandas as pd
import numpy as np

#create pandas Series with some NaN values
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan])

#count occurrences of unique values in Series, including NaNs
my_series. value_counts (dropna= False )

3.0 4
4.0 2
7.0 2
NaN2
8.0 1
9.0 1
dtype: int64

예시 3: 고유 값의 상대 빈도 계산

다음 코드는 Normalize 인수를 사용하여 Pandas 시리즈에서 고유 값의 상대 빈도를 계산하는 방법을 보여줍니다.

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (normalize= True )

3 0.4
4 0.2
7 0.2
8 0.1
9 0.1
dtype:float64

이는 우리에게 다음을 알려줍니다.

  • 값 3은 계열의 모든 값의 40%를 나타냅니다.
  • 값 4는 계열의 모든 값의 20%를 나타냅니다.
  • 값 7은 계열의 모든 값의 20%를 나타냅니다.

등등.

예시 4: 빈의 빈도 계산

다음 코드는 bins 인수를 사용하여 동일한 크기의 bin에 속하는 pandas 계열 값의 빈도를 계산하는 방법을 보여줍니다.

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (bins= 3 )

(3.0, 5.0] 6
(5.0, 7.0] 2
(7.0, 9.0] 2
dtype: int64

이는 우리에게 다음을 알려줍니다.

  • 3과 5 사이에는 6개의 값이 있습니다.
  • 5와 7 사이에는 2개의 값이 있습니다.
  • 7과 9 사이에는 2개의 값이 있습니다.

예시 5: Pandas DataFrame에서 값의 빈도 계산

또한 value_counts() 함수를 사용하여 pandas DataFrame의 특정 열에 있는 고유 값의 빈도를 계산할 수도 있습니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#count occurrences of unique values in 'points' column
df[' points ']. value_counts ()

9 3
10 2
13 1
15 1
22 1
Name: points, dtype: int64

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 기능을 사용하는 방법을 설명합니다.

Pandas에서 explain() 함수를 사용하는 방법
Pandas에서 행 수를 계산하는 방법
팬더에서 그룹 목격 횟수를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다