Pandas value_counts() 함수 사용 방법(예제 포함)
value_counts() 함수를 사용하여 팬더 시리즈에서 고유한 값의 빈도를 계산할 수 있습니다.
이 함수는 다음 기본 구문을 사용합니다.
my_series. value_counts ()
다음 예에서는 이 구문을 실제로 사용하는 방법을 보여줍니다.
예시 1: 고유 값의 빈도 계산
다음 코드는 Pandas 시리즈에서 고유 값의 발생 횟수를 계산하는 방법을 보여줍니다.
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts () 3 4 4 2 7 2 8 1 9 1 dtype: int64
이는 우리에게 다음을 알려줍니다.
- 값 3이 4 번 나타납니다.
- 값 4가 두 번 나타납니다.
- 값 7이 두 번 나타납니다.
등등.
예시 2: 고유 값의 카운트 빈도(NaN 포함)
기본적으로 value_counts() 함수는 NaN 값의 빈도를 표시하지 않습니다.
그러나 dropna 인수를 사용하여 NaN 값의 빈도를 표시할 수 있습니다.
import pandas as pd import numpy as np #create pandas Series with some NaN values my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan]) #count occurrences of unique values in Series, including NaNs my_series. value_counts (dropna= False ) 3.0 4 4.0 2 7.0 2 NaN2 8.0 1 9.0 1 dtype: int64
예시 3: 고유 값의 상대 빈도 계산
다음 코드는 Normalize 인수를 사용하여 Pandas 시리즈에서 고유 값의 상대 빈도를 계산하는 방법을 보여줍니다.
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (normalize= True ) 3 0.4 4 0.2 7 0.2 8 0.1 9 0.1 dtype:float64
이는 우리에게 다음을 알려줍니다.
- 값 3은 계열의 모든 값의 40%를 나타냅니다.
- 값 4는 계열의 모든 값의 20%를 나타냅니다.
- 값 7은 계열의 모든 값의 20%를 나타냅니다.
등등.
예시 4: 빈의 빈도 계산
다음 코드는 bins 인수를 사용하여 동일한 크기의 bin에 속하는 pandas 계열 값의 빈도를 계산하는 방법을 보여줍니다.
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (bins= 3 ) (3.0, 5.0] 6 (5.0, 7.0] 2 (7.0, 9.0] 2 dtype: int64
이는 우리에게 다음을 알려줍니다.
- 3과 5 사이에는 6개의 값이 있습니다.
- 5와 7 사이에는 2개의 값이 있습니다.
- 7과 9 사이에는 2개의 값이 있습니다.
예시 5: Pandas DataFrame에서 값의 빈도 계산
또한 value_counts() 함수를 사용하여 pandas DataFrame의 특정 열에 있는 고유 값의 빈도를 계산할 수도 있습니다.
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #count occurrences of unique values in 'points' column df[' points ']. value_counts () 9 3 10 2 13 1 15 1 22 1 Name: points, dtype: int64
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 기능을 사용하는 방법을 설명합니다.
Pandas에서 explain() 함수를 사용하는 방법
Pandas에서 행 수를 계산하는 방법
팬더에서 그룹 목격 횟수를 계산하는 방법